先週は、Microsoftクラウドサービスにとって完全な悪夢でした。 によって引き起こされる複数のシステム障害 Azure をもたらしたADの問題 Microsoft 365 ひざまずいて、数日後にオンラインのExchangeの負荷分散の問題が発生し、Microsoftのクラウドベース collaboration 環境は、ITの複雑さに対する回復力の欠如を示しました。

ダウンタイムが始まってから数時間後にMicrosoftが報告したように、 「…19年15月15日の2021:XNUMXUTC頃、一部のお客様は、Microsoft Teams、Officeおよび/またはDynamics、Xbox Live、および Azure ポータル、" から Azure ステータスページ.

根本原因と緩和
出典:https:// status。azure.com / en-us / status / history /

そして、数日後、負荷分散の問題により、XNUMX番目のインシデントがMicrosoftクラウドインフラストラクチャに影響を与え、ExchangeOnlineに影響を与えました。

根本原因メッセージMicrosoft
出典:https:// status。azure.com / en-us / status / history /

これらが Microsoftのクラウド環境の最初の停止ではありません、そしてそれらは最後ではありません。 次の問題が発生した場合に、組織は対応を改善するために何ができるでしょうか。

学んだ教訓–雨の日の準備をする

サービス停止に対するMicrosoftの一般的な対応は、問題に関する一般的な情報を提供するTwitterやその他の通信方法を介してアナウンスを送信することです。 さまざまな地域でホストされている企業組織への影響のヒントはめったにありません。 代わりに、企業は、これらの停止が発生したときに答えを探すことに悩まされ、後でもう一度確認するように求められます。

Twitterメッセージ Microsoft 365 Status:
出典:https:// status。azure.com / en-us / status / history /

彼らの名誉のために、マイクロソフトは停止中の良好な継続的なステータス情報を提供しますが、詳細はまだ一般的であり、顧客は自分自身を守る必要があります。

では、もしも? 早期警報システムがある場合はどうなりますか? ITグループに、現在影響を受けているワークロードや現在影響を受けているリージョンなど、停止の詳細を提供するアラートがあった場合はどうなりますか? この情報を使用して、アクションを実行し、ヘルプデスクサポートグループに通知し、チーム会議のスケジュールを変更するように従業員に通知できます。

最近の中、 M365 お客様が使用している停電 OfficeExpert TrueDEM EPMにはその機能がありました。 彼らはマイクロソフトの発表に先立って早期警告を発し、 actionable insights 彼らの利益に。

OfficeExpert TrueDEM EPMと地域の停止の違い

北米ではほとんどのサービスがダウンしていましたが、お客様はExchange Onlineがダウンしていないことに気付きました(下のスクリーンショットを参照)。 と sExchangeがまだ稼働しているため、ITサポートグループは従業員に翌日までチーム会議のスケジュールを変更するように促しました。 ビジネスパートナーや顧客との混乱を回避します。

全体としては、影響に差があった。 M365 サービスの利用可能性は地理的地域によって異なります。  OfficeExpert TrueDEM EPMはそれらを特定し、マイクロソフトが最初の発表を送信する30分前に詳細をお客様に提供しました。

北米の視点

次の4つのスクリーンショットは、北米のお客様が実行しているものです。 OfficeExpert TrueDEM EPM。 停止がExchangeOnline(EXO)サービスに影響を与えなかったことがわかりますが、Teams、OneDrive、SharePointなどの他のサービスは何時間も完全に使用できなくなっていました。

北米での停止に対する分析の視覚化
注:上記のタイムスタンプは米国東部標準時(ET)です

ヨーロッパの視点

ヨーロッパのお客様は、Exchange (EXO) アクセスや他の主要なワークロードを失ったため、異なる経験をしました。 最初に Microsoft Teams の可用性に影響があり、次に OneDrive と SharePoint が影響を受け、約 XNUMX 時間後に EXO がダウンしました。 これらの停止は北米のダウンタイムと比べて「営業時間外」に発生したため、ビジネスへの影響はそれほど大きくありませんでした。 以下のグラフに示されているデータに基づいて、次のことがわかります。 M365 サービスはすべて午前 3 時頃から稼働しており、その間に多少の空き時間はありました。

ヨーロッパ:Teams Service図1:Teams Service
図2:Exchange Online Service
図3:OneDriveサービス
図4:SharePoint Online Service

注: タイムスタンプの上は中央ヨーロッパ時間(CET)です

早期警報システムに投資する

停電 M365 再び起こるだろうが、その多くは時間の経過とともに証明されている。 このような予測不可能な事態に IT サポート グループがどのように対応できるかは、あなた次第です。 一部の企業組織にとって、この種のダウンタイムはビジネスにとって非常に重要です。 従業員やパートナーを指導する上で最善の決定を下せるように、詳細な情報が必要です。 どちらを知るか M365 サービスが影響を受ける場合、ヘルプデスクへの問い合わせが殺到する前に、エンドユーザーに通知して緊急時対応計画を適用することで、プロアクティブに作業できるようになります。

  • 詳細な手順を準備するためにヘルプデスクに警告する
  • 停止中にさまざまな通信モードに切り替えます
  • 会議を翌日に再スケジュールする
  • コミュニケーションの遅れを予想するようにビジネスパートナーと顧客に通知する

詳細はこちら…

あなたが私たちについてもっと学ぶことに興味があるなら OfficeExpert TrueDEM EPM data analytics ソリューションと、それがサービスの可用性を監視し、従業員のビジネス継続性を維持するのにどのように役立つかについては、次の概要ページをご覧ください。 https://www.panagenda.com/products/officeexpert/.

お困りの方は マーケティング Cookie を受け入れる このビデオを見るには 。