Amazon、ヒューマンエラーによる大規模な機能停止が発生

2月28日の朝にAmazon S3サービスがほぼ4時間無駄になったときに感じた何千もの中小企業は、ドラムロール…間違って入力された1つのコマンドが原因で発生しました。言い換えれば、それは人的ミスでした。タイプミスです。

Amazon S3が停止した原因

Amazonから説明をそのまま（NASDAQ：AMZN）取得しているだけなので、Amazon S3が停止した原因について同社が述べたことは次のとおりです。

$config[code] not found

「PSTの午前9時37分に、確立されたプレイブックを使用している許可されたS3チームメンバーが、S3請求プロセスで使用されるS3サブシステムの1つに対して少数のサーバーを削除することを目的としたコマンドを実行しました。残念ながら、コマンドへの入力の1つが誤って入力されていて、意図したよりも多数のサーバーが削除されました。誤って削除されたサーバーは、他の2つのS3サブシステムをサポートしていました。これらのサブシステムの1つであるインデックスサブシステムは、リージョン内のすべてのS3オブジェクトのメタデータと位置情報を管理します。」

それはより詳細になりますが、これは全体を刺激したものです。 Amazonは、イベントが発生したときに徹底的にスケジュールを設定して、イベントに関して全員を最新の状態に保つという点で非常に透明で効果的でした。

企業はデータを失いませんでしたし、その影響でタイムリーにリソースにアクセスできなかったことも重要です。これはイベント全体の一部でした。しかし、それらのリソースに頼っている企業にとって、それは悪い日でした。

この事件と2015年の事件、そして将来起こるものは、デジタルプレゼンスを持つ人にとって価値のある教訓となるでしょう。あなたのウェブサイトがあなたのビジネスの重要な部分であるならば、異なる場所でホストされている同じウェブサイトのバージョンを持っていてください。さまざまなホスト企業と話をして、あなたのすべてのニーズに対応できる最高の企業を見つけましょう。

会社に適したシステムを設定するためのガイドとなる、障害回復および事業継続（DR / BC）ソリューションもあります。早く実装するほど、リラックスすることができます。あなたのレンガとモルタル店と同じように、あなたはあなたのデジタル資産を保護することに積極的にならなければなりません。

Amazon S3フォトvia Shutterstock

コメント▼