Die letzte Woche war ein absoluter Albtraum für die Cloud-Dienste von Microsoft. Mit mehreren Systemausfällen verursacht durch Azure AD-Probleme, die gebracht haben Microsoft 365 in die Knie, gefolgt von Lastausgleichsproblemen für Exchange online, ein paar Tage später, das Microsoft Cloud-basierte collaboration Die Umgebung zeigte ihre mangelnde Widerstandsfähigkeit gegenüber der IT-Komplexität.

Einige Stunden nach Beginn der Ausfallzeit teilte Microsoft mit: "... at approximately 19:15 UTC on 15 Mar 2021, a subset of customers may experience issues authenticating into Microsoft services, including Microsoft Teams, Office and/or Dynamics, Xbox Live, and the Azure Portal," über die Azure-Statusseite.

Grundursache und Schadensbegrenzung
Quelle: https://status.azure.com/en-us/status/history/

Und dann, ein paar Tage später, traf ein zweiter Vorfall die Microsoft-Cloud-Infrastruktur und beeinträchtigte Exchange Online aufgrund von Lastausgleichsproblemen.

Grundursachenmeldung Microsoft
Quelle: https://status.azure.com/en-us/status/history/

Diese waren nicht die ersten Ausfälle in der Cloud-Umgebung von Microsoft, und es werden auch nicht die letzten sein. Was können Unternehmen tun, um bei der nächsten Störung besser reagieren zu können?

Lessons Learned – auf einen schlechten Tag vorbereitet sein

Die typische Reaktion von Microsoft auf einen Dienstausfall ist die Versendung von Ankündigungen über Twitter und andere Kommunikationsmethoden mit allgemeinen Informationen über das Problem. Nur selten gibt es einen Hinweis auf die Auswirkungen auf Unternehmensorganisationen, die in verschiedenen Regionen gehostet werden. Stattdessen werden die Unternehmen bei solchen Ausfällen auf der Suche nach Antworten im Stich gelassen und gebeten, sich später wieder zu melden.

Twitter-Nachricht von Microsoft 365 Status
Quelle: https://status.azure.com/en-us/status/history/

Es ist zwar zu begrüßen, dass Microsoft während des Ausfalls gute Informationen über den aktuellen Status bereitstellt, aber die Details sind immer noch sehr allgemein gehalten, so dass die Kunden auf sich selbst gestellt sind.

Und was wäre, wenn? Was wäre, wenn Sie ein Frühwarnsystem hätten? Was wäre, wenn Ihre IT-Gruppe über Warnmeldungen verfügte, die die Einzelheiten des Ausfalls enthielten, einschließlich der Frage, WELCHE Arbeitslasten derzeit betroffen sind und WELCHE Regionen derzeit betroffen sind? Mit diesen Informationen könnten Sie Maßnahmen ergreifen, die Helpdesk-Supportgruppen benachrichtigen und Ihre Mitarbeiter informieren, damit sie ihre Teambesprechungen verschieben können.

Während der jüngsten M365 Ausfälle, die unsere Kunden nutzen OfficeExpert TrueDEM EPM verfügte über diese Fähigkeit. Sie hatten die Frühwarnung vor der Ankündigung von Microsoft und konnten diese nutzen actionable insights zu ihrem Vorteil.

OfficeExpert TrueDEM EPM und die regionalen Ausfallunterschiede

Während die meisten Dienste in Nordamerika ausgefallen waren, stellten unsere Kunden fest, dass Exchange online nicht funktionierte (siehe Screenshots unten). Und sda Exchange immer noch funktionierte, forderten ihre IT-Gruppen ihre Mitarbeiter auf, ihre Teams-Besprechungen auf den nächsten Tag zu verschieben und jede Verwirrung bei Geschäftspartnern und Kunden zu umgehen.

Insgesamt gab es Unterschiede bei der Auswirkung von M365 Serviceverfügbarkeit abhängig von Ihrer geografischen Region.  OfficeExpert TrueDEM EPM identifizierte sie und übermittelte unseren Kunden die Details 30 Minuten bevor Microsoft ihre ersten Ankündigungen verschickte.

Aus der nordamerikanischen Perspektive

Die folgenden 4 Screenshots stammen von unseren laufenden Kunden in Nordamerika OfficeExpert TrueDEM EPM. Wie Sie sehen, hatte der Ausfall keine Auswirkungen auf den Exchange Online (EXO)-Dienst, die anderen Dienste wie Teams, OneDrive und SharePoint waren jedoch stundenlang völlig außer Betrieb.

Analytics-Visualisierung für Ausfall in Nordamerika
Hinweis: Die obigen Zeitstempel sind East US Time (ET)

Aus der europäischen Perspektive

Unsere Kunden in Europa machten eine andere Erfahrung, als sie den Zugang zu Exchange (EXO) und den anderen Haupt-Workloads verloren. Die Verfügbarkeit von Microsoft Teams war zuerst betroffen, gefolgt von OneDrive und SharePoint, und etwa eine Stunde später fiel EXO aus. Die Auswirkungen auf das Geschäft waren nicht so groß, da diese Ausfälle außerhalb der Geschäftszeiten stattfanden, verglichen mit den Ausfallzeiten in Nordamerika. Anhand der Daten in den nachstehenden Diagrammen können Sie sehen, dass alle M365-Dienste um 3:00 herum wieder verfügbar waren, mit einer geringfügigen Verfügbarkeit dazwischen.

Europa: Teams-Dienst Abbildung 1: Teams-Dienst
Abbildung 2: Exchange Online-Dienst
Abbildung 3: OneDrive-Dienst
Abbildung 4: SharePoint Online-Dienst

Hinweis:Obige Zeitstempel sind Mitteleuropäische Zeit (MEZ)

Investieren Sie in ein Frühwarnsystem

Ausfälle von M365 werden immer wieder vorkommen, das hat sich im Laufe der Zeit gezeigt. Wie Ihre IT-Support-Gruppen in diesen unvorhersehbaren Fällen reagieren können, hängt von Ihnen ab. Für einige Unternehmen ist diese Art von Ausfallzeit geschäftskritisch. Sie benötigen detaillierte Informationen, damit sie die besten Entscheidungen für ihre Mitarbeiter und Partner treffen können. Wenn sie wissen, welche M365-Dienste betroffen sind, können sie proaktiv arbeiten, die Endanwender benachrichtigen und Notfallpläne anwenden, bevor sie mit Helpdesk-Anrufen überschwemmt werden:

  • Informieren Sie Ihren Helpdesk, um detaillierte Anweisungen vorzubereiten
  • Wechseln Sie während des Ausfalls zu anderen Kommunikationsmethoden
  • Verschieben Sie Termine auf den nächsten Tag
  • Informieren Sie Geschäftspartner und Kunden, dass sie mit verzögerten Mitteilungen rechnen müssen

Mehr herausfinden...

Wenn Sie mehr über unsere erfahren möchten OfficeExpert TrueDEM EPM data analytics Lösung und wie sie Ihnen helfen kann, die Serviceverfügbarkeit zu überwachen und die Geschäftskontinuität für Ihre Mitarbeiter aufrechtzuerhalten, besuchen Sie bitte unsere Übersichtsseite unter https://www.panagenda.com/products/officeexpert/.

Bitte kontaktieren Sie uns, wenn Sie Probleme im Zusammenhang mit dieser Website haben oder Akzeptieren Sie Marketing-Cookies um dieses Video anzusehen.