先週、世界中のいくつかの組織がOffice365の停止の影響を受けました。 Exchange Onlineサービスは、数時間完全に利用できませんでした。 メールボックスにアクセスできなかった人もいれば、メール配信のパフォーマンス(送信/受信)が悪かった人もいました。

おっと! そこにそれがある…

結果は明らかです。 生産性の低下、エンドユーザーエクスペリエンスの低下、エンドユーザーのフラストレーションの増幅、ビジネススピードの低下、信頼の喪失。 そして、それはビジネスに重大な影響を与える可能性のあるもののいくつかに名前を付けているだけです。

Microsoft 365 停止マップ(出典:Downdetector)

興味深いことに、このインシデントがログに記録されたケース(EX172491)は、その間にMicrosoftによって削除されました。

いつでも特定のリスクがあることは誰もが知っています。 クラウドサービス 使用されています。 ただし、重要な質問が常に XNUMX つあります。このようなことが組織に起こった場合に、どの程度の準備ができているかということです。 または言い換えれば – あなたは何ですか バックアップ計画?

確かに、安定した高性能のクラウド製品に日常的に依存している多くのエンドユーザー、管理者、および企業にとっての基本的な質問です。

安全な側を散歩する

Office 365のインストールを監視することは、エンタープライズアプリケーションで必要な情報をリアルタイムで取得するための重要な最初のステップです。 アプリケーションインフラストラクチャの非常に重要な部分は、そのパフォーマンスを理解していない限り、効果的に管理することはできません。 早い insights 可用性については、停止に備えるのに役立ちます。

誰が影響を受けるかを知ることは、問題を解決するための重要な要素です(たとえば、エンドユーザーに通知する)。 人々のグループのみ、ユーザーのサブセット(Office 365のMulti-Geo機能が使用されている場合)、またはクラウドテナントを使用している組織全体。

OfficeExpert 考えられる影響の大きさを特定するのに役立つソリューションを提供します。

さらに、メールフローシミュレーションセンサーを使用して OfficeExpert、組織は、システムが何らかの形で復元されたことを確認できた可能性があります(メールボックスへのアクセスは再び機能しました)。 彼らはまた、メールを送受信する基本的なサービスがまだ事件によって損なわれているのを見たかもしれません。 次のスクリーンショットは、23月26日からXNUMX日までの間にメール配信時間が着実に増加したことを示しています。

停止パターン(出典: OfficeExpert)

エンドユーザーに確実なビジネス継続性を確保する

この透明性は、特定のサービスが完全に復元されていないことを知るのに役立ちます。 また、それに応じて計画とコミュニケーションを行う方法を理解するのにも役立ちます。 結局のところ、これは当然エンドユーザーにもメリットがあります。

通知を監視することで、問題が存在することを最初に発見できます。 マイクロソフトが数時間後にそれについてツイートする前でさえ。 影響を受けるサービスを知ることで、ユーザーに通知し、ユーザーチケットが殺到する前に緊急時対応計画を適用することで、積極的に作業することができます。

更新:29月XNUMX日にさらに停止します!

29年2019月365日に、ユーザーがOfficeXNUMXサービスを認証してアクセスできなくなった別の大規模な停止が発生しました。 Azure この事件の影響も受けました。 Microsoftによって伝えられた根本的な原因は、内部DNSプロバイダーとしてのCenturyLinkのDNSの問題でした。

次のスクリーンショットは、その方法を示しています OfficeExpert この停止を確認して測定しました。 Skype for BusinessServiceのダウンタイムは約3時間でした。 Exchange Onlineなどの他のサービスは、約1時間影響を受けました。 失敗インジケーター(スクリーンショットのエラーメッセージ)は、特定の完全修飾ドメイン名を解決できなかったことを示します。 これは、Microsoftの根本原因ステートメントと完全に一致します。

Office 365の停止29年2019月XNUMX日(出典: OfficeExpert)

更新:365月2日のOXNUMXの停止!

2月10日午後10時1分(太平洋標準時)にマイクロソフトは次のメッセージを送信しました。SharePointとOneDriveへのアクセスに影響する問題を認識して調査しています。 詳細については、管理センターのSP10およびOD178746を参照してください。

当初、Microsoftは情報を提供することができませんでした community。 世界中のユーザーは、なぜ問題が発生しているのかを知るために、ソーシャルメディアのうわさ工場に頼らざるを得ませんでした。 生産性に悪影響を及ぼしたコアサービスには、 Azure、複数 Microsoft 365 サービス、ダイナミクス、DevOps。

以下のスクリーンショットでは、次のことがわかります。 OfficeExpert 中央ヨーロッパ夏時間午後9時50分に停止を特定しました。 これはいっぱいでした 最初のMicrosoft通信が送信される20分前。*

共有ポイント、 Azure、Office365の停止2月。 2019年XNUMX月XNUMX日(出典: OfficeExpert)

私たちは、お客様から受け取った肯定的なフィードバックに非常に満足しています。 OfficeExpert。 彼らは、関連するサブサービスが公開される前に、それらのグローバルな停止を自分たちで特定することができました。

これはグローバルのようでした Azure Office1サービスの復元に365時間以上かかったXNUMX月の停止。 クラウドの停止がビジネスに与える影響を最小限に抑えるにはどうすればよいかという疑問が再び浮かび上がります。

このトピックの詳細については、 white paper。 ドイツ語を話す人も、 webinar MVPのマイケル・グレスとステファン・フライドと クラウドの停止中に何をすべきかについて。

*公開されている情報源によると