AWSの障害情報を確認する方法を紹介|発生時のリスクとは?
中小企業や大企業、金融機関や行政機関など、さまざまな企業・機関で導入されているAWSですが、過去に何度か障害が発生しているのをご存じでしょうか。
AWSを導入する際、メリットや効果だけではなく、どのような障害が起こるのかを把握したうえで判断することがポイントです。
本記事では、AWSの障害について、過去に起こった障害情報やリアルタイムで情報を確認する方法を紹介します。AWSの障害で起こりうるリスクも紹介するので、これからAWSを導入しようか迷っている企業はぜひ参考にしてください。
こちらの資料では、AWSの導入を検討されている方へ向けて、AWSの基礎知識から構築ステップ、よくある質問まで、最低限押さえておいた方が良い情報をまとめております。
もし、今AWSによるWEBサービスの構築や設計をお考えの方は下記の資料を確認しながら、AWSの特性や自社にマッチしているかをご確認ください。
目次
過去に起こった代表的なAWSの障害
さまざまな企業が導入しているAWSですが、世界各国で障害が発生した事例がいくつかあります。これからAWSを導入しようとしている企業は、起こりうるリスクを把握するために、過去に起こった代表的なAWSの障害を確認しておきましょう。
欧州リージョン(eu-west)の障害
欧州リージョン(eu-west)の障害は、2011年8月8日に発生した落雷によるものです。雷が落ちて、給電用の変圧器が故障してしまいました。
電力の供給が止まり、EC2、EBS、RDSとのAWSサービスが一時的に利用できない事態が起こりました。特に、EC2は仮想サーバーを起動するのに必要なので、大きな損害が発生した企業もあったでしょう。
米国東部リージョン(us-east)の障害
米国東部リージョン(us-east)の障害は、2015年9月20日に発生したものです。Amazon DynamoDBという新機能を追加したタイミングで、使用している物理サーバーでネットワーク障害が起こっています。
またネットワーク障害だけではなく、Amazon DynamoDBのユーザー数が想定よりも上回ってしまったことも原因のひとつです。さまざまな原因が重なったことで、大きな障害につながりました。
この障害によって、DynamoDBを利用しているAWSサービスを利用できなくなるといった事態が起こりました。
東京リージョン(ap-northeast-1)の障害
東京リージョン(ap-northeast-1)の代表的な障害は、過去に3度発生しています。ここでは、2019年8月23日、2021年4月20日、2021年9月2日に起こったAWSの障害について解説します。
2019年8月23日
2019年8月23日に発生した東京リージョン(ap-northeast-1)の障害は、データセンターの冷却システムが止まってしまうものです。物理サーバーの温度の許容限度を超えてしまったことで、サーバー自体の電源が落ち、大きな損失が発生した企業がいくつかありました。
この障害によって、国内でキャッシュレス決済が使えなくなったり、ゲームアプリが起動しなかったりなどの事態が起こりました。システム停止までいかなくても、AWSサービスの性能が落ちたケースもあります。
2021年2月20日
2021年2月20日に発生したアベイラビリティゾーン(apne1-az1)の障害は、データセンターの温度が上昇したことで起こったものです。この障害により、EC2への接続に問題が発生しています。
2021年4月20日
2021年4月20日に発生した東京リージョン(ap-northeast-1)の障害は、SQSのAPIのエラーレートが上昇したことで発生したものです。この障害により、Amazon LambdaやAmazon CloudWatch、AWS CloudFormationなどのサービスで、エラーや遅延などの影響が出たと報告されています。
2021年9月2日
2021年9月2日に発生した東京リージョンの障害は、AWS Direct Connectのネットワークデバイスに問題があったことで起こったものです。特定の場所ではなく、すべての東京リージョンで影響が出ました。
東京リージョンすべてに影響が出た理由は、すべてのアベイラビリティゾーンに接続する際に使用されるコアネットワークデバイスに問題が発生したためです。
AWSの障害情報をリアルタイムで確認する方法
AWSで起こりうるリスクに対して備えるためには、どのような障害が起こっているか、障害や問題が起こっていないかを確認することが大切です。障害情報をいち早く知ることで、スムーズに対応できるでしょう。
ここでは、AWSの障害情報をリアルタイムで確認する方法を4つ紹介します。
AWS Health Dashboard
AWS Health Dashboardは、AWSのクラウドインフラストラクチャに関する情報と状態をリアルタイムでユーザーに提供するためのオンラインツールです。
AWSのサービスの可用性、パフォーマンス、イベントに関する情報を中央集約しており、AWSのカスタマーおよびAWSパートナーにとって重要なリソースです。
また各サービスごとに用意されているRSSフィードを登録すると、サービスの掲載内容に変更や更新があった場合に、通知で情報を受け取れます。
AWSの公式Twitterアカウントでは、AWSの障害をいち早く報告しています。障害が起こった際だけではなく、障害が修復した際にもTwitterで発信しています。
ツイート内容は、日本語で表記されているので、英語がわからない方でも安心して情報を確認できるでしょう。通知設定をオンにすることで、ツイート情報をスムーズに受け取れます。
Downdetector
Downdetectorとは、過去24時間以内に起こったAWSの障害を確認できるサイトです。AWSでの障害が確認された場合、ユーザー自らが報告することができ、AWS側が探知していない障害情報をいち早く知れる可能性があります。
サイト内には、AWSで発生したトラブルや問題に関する情報を共有できるコミュニティが存在します。AWS Health DashboardやTwitterアカウントで報告されていないけど、AWSが使えないなどの異変を感じた場合に参考にできるでしょう。
リリースノート
AWSのリリースノートは、AWSのサービスや機能の更新、追加、修正などに関する情報を詳細に記載した公式ドキュメントです。障害の原因や修復結果などのほかに、アップデートや新機能追加に関する情報も掲載されています。
ただし、速報で障害情報を知れるわけではありません。たとえば、2019年8月23日に発生した障害の場合、2日後の9月25日に発表されています。数日遅れで報告されることがあるので、過去の障害情報を確認する際におすすめです。
AWSで障害が発生するとどのようなリスクがある?
過去にAWSの障害があったと聞くものの、具体的に自社でどのような問題が発生するのかイメージできない方がいるのではないでしょうか。ここでは、AWSの障害によって起こりうるリスクを4つ紹介します。
システムが稼働しない
AWSの障害によりシステムが稼働しないとなると、システムやアプリケーションが一時的に利用できなくなってしまいます。企業とユーザーをつなぐものがなくなるということは、ユーザーやクライアントからのリクエストに応答できなくなることにつながります。
オンラインショッピングや金融サービスなど、AWS上でビジネスを行っている場合は、ダウンタイムによって売上や利益の損失が生じる恐れがあるでしょう。
データが紛失する
AWSの障害でデータが紛失すると、ビジネスの運営が困難になる場合があります。特に、取引記録や顧客データなどの重要な情報が失われた場合、大きな損失を招くリスクにつながりやすいです。
データ保護に関する法律や規制を遵守している場合、データの紛失は違反となる恐れがあり、罰金や訴訟のリスクも考えられます。データ紛失の背後には、セキュリティの脆弱性や攻撃が隠れていることもあるので、ほかの機密情報が第三者に漏洩するリスクも考慮する必要があります。
ユーザーからの信頼度が下がる
AWSの障害によりユーザーからの信頼を失うと、新規顧客の獲得が困難になるだけでなく、既存の顧客もサービスを離れるリスクがあります。
長期的に築いてきたブランドイメージや評価を一気に悪化させる恐れがあり、マーケティングや広告活動の効果が減少してしまうことも心配されます。特にデジタル時代において、ネガティブな情報や評価は瞬時に拡散されやすいです。
また一度失った信頼を再建するのは、たくさんの時間と労力が必要です。顧客の離脱や新規顧客の獲得機会の減少は、直接的に収益の減少につながる可能性があるので、直ちに対応する必要があるでしょう。
復旧コストがかかる
障害の復旧には、外部の専門家やツール、リソースの購入などのコストが発生する可能性があります。サービス提供者として、顧客に対して補償やサービスの延長を行う必要が生じる場合があり、これに伴うコストも発生するケースがあります。
またデータが損失された場合、データを再取得や再構築する際にコストがかかることが考えられます。システムの復旧に時間がかかると、ビジネスの運営を一時的に中断しなければいけないこともあるでしょう。
まとめ
過去には、AWSの欧州リージョンや米国東部リージョン、東京リージョンなどで障害が発生しています。
AWSの障害が発生する原因は、AWS側が管理している物理サーバーの温度上昇やネットワーク障害などが多いです。
なかには、落雷などの自然現象が原因のケースもあり、障害を避けられない状況になる可能性があるといえるでしょう。
またAWSの障害によって、システムが完全に停止したり、ユーザーからの信頼度が下がったりするリスクがあります。そのためAWSを導入する際には、起こりうる障害やそれによって起こりうるリスク、対策などを確認しておきましょう。
こちらの資料では、AWSの導入を検討されている方へ向けて、AWSの基礎知識から構築ステップ、よくある質問まで、最低限押さえておいた方が良い情報をまとめております。
もし、今AWSによるWEBサービスの構築や設計をお考えの方は下記の資料を確認しながら、AWSの特性や自社にマッチしているかをご確認ください。