Hinweis: Dieser deutsche Text wird zu Ihrer Erleichterung zur Verfügung gestellt. Er wurde maschinell übersetzt und nicht manuell nachbearbeitet. Die englischsprachige Originalversion gilt als die offizielle Version und enthält immer die aktuellen Informationen.

Globaler Ausfall von Microsoft 365 - mit Nachbeben, die Exchange online betreffen

Die vergangene Woche war ein wahrer Albtraum für die Cloud-Dienste von Microsoft. Mit mehreren Systemausfällen, verursacht durch Azure AD-Probleme, die Microsoft 365 in die Knie zwangen, gefolgt von Lastausgleichsproblemen für Exchange online ein paar Tage später, zeigte die Cloud-basierte Collaborationsumgebung von Microsoft ihre mangelnde Belastbarkeit für IT-Komplexität.

by Stefan Fried

Die vergangene Woche war ein wahrer Albtraum für die Cloud-Dienste von Microsoft. Mit mehreren Systemausfällen, verursacht durch Azure AD-Probleme, die Microsoft 365 in die Knie zwangen, gefolgt von Lastausgleichsproblemen für Exchange online ein paar Tage später, zeigte die Cloud-basierte Collaborationsumgebung von Microsoft ihre mangelnde Belastbarkeit für IT-Komplexität.

Einige Stunden nach Beginn der Ausfallzeit teilte Microsoft mit: "... at approximately 19:15 UTC on 15 Mar 2021, a subset of customers may experience issues authenticating into Microsoft services, including Microsoft Teams, Office and/or Dynamics, Xbox Live, and the Azure Portal," über die Azure-Statusseite.

Grundursache und Schadensbegrenzung
Quelle: https://status.azure.com/en-us/status/history/

Und dann, ein paar Tage später, traf ein zweiter Vorfall die Microsoft-Cloud-Infrastruktur und beeinträchtigte Exchange Online aufgrund von Lastausgleichsproblemen.

Grundursachenmeldung Microsoft
Quelle: https://status.azure.com/en-us/status/history/

Diese waren nicht die ersten Ausfälle in der Cloud-Umgebung von Microsoft, und es werden auch nicht die letzten sein. Was können Unternehmen tun, um bei der nächsten Störung besser reagieren zu können?

Lessons Learned – auf einen schlechten Tag vorbereitet sein

Die typische Reaktion von Microsoft auf einen Dienstausfall ist die Versendung von Ankündigungen über Twitter und andere Kommunikationsmethoden mit allgemeinen Informationen über das Problem. Nur selten gibt es einen Hinweis auf die Auswirkungen auf Unternehmensorganisationen, die in verschiedenen Regionen gehostet werden. Stattdessen werden die Unternehmen bei solchen Ausfällen auf der Suche nach Antworten im Stich gelassen und gebeten, sich später wieder zu melden.

Twitter-Nachricht von Microsoft 365 Kategorie
Quelle: https://status.azure.com/en-us/status/history/

Es ist zwar zu begrüßen, dass Microsoft während des Ausfalls gute Informationen über den aktuellen Status bereitstellt, aber die Details sind immer noch sehr allgemein gehalten, so dass die Kunden auf sich selbst gestellt sind.

Und was wäre, wenn? Was wäre, wenn Sie ein Frühwarnsystem hätten? Was wäre, wenn Ihre IT-Gruppe über Warnmeldungen verfügte, die die Einzelheiten des Ausfalls enthielten, einschließlich der Frage, WELCHE Arbeitslasten derzeit betroffen sind und WELCHE Regionen derzeit betroffen sind? Mit diesen Informationen könnten Sie Maßnahmen ergreifen, die Helpdesk-Supportgruppen benachrichtigen und Ihre Mitarbeiter informieren, damit sie ihre Teambesprechungen verschieben können.

Während der letzten M365-Ausfälle hatten unsere Kunden, die OfficeExpert EPM einsetzen, diese Möglichkeit. Sie waren frühzeitig vor der Ankündigung von Microsoft gewarnt und konnten die verwertbaren Erkenntnisse zu ihrem Vorteil nutzen.

OfficeExpert EPM und die regionalen Unterschiede bei den Ausfällen

Während die meisten Dienste in Nordamerika ausgefallen waren, stellten unsere Kunden fest, dass Exchange online nicht funktionierte (siehe Screenshots unten). Und sda Exchange immer noch funktionierte, forderten ihre IT-Gruppen ihre Mitarbeiter auf, ihre Teams-Besprechungen auf den nächsten Tag zu verschieben und jede Verwirrung bei Geschäftspartnern und Kunden zu umgehen.

Insgesamt gab es Unterschiede bei den Auswirkungen der M365-Dienstverfügbarkeit je nach geografischer Region. OfficeExpert EPM hat diese identifiziert und unsere Kunden mit den Details versorgt, 30-Minuten bevor Microsoft seine ersten Ankündigungen verschickte.

Aus der nordamerikanischen Perspektive

Die folgenden 4-Screenshots stammen von unseren nordamerikanischen Kunden, die OfficeExpert EPM einsetzen. Sie sehen, dass der Ausfall keine Auswirkungen auf den Exchange Online (EXO)-Dienst hatte, aber die anderen Dienste wie Teams, OneDrive und SharePoint waren stundenlang komplett außer Betrieb.

Analytics-Visualisierung für Ausfall in Nordamerika
Hinweis: Die obigen Zeitstempel sind East US Time (ET)

Aus der europäischen Perspektive

Unsere Kunden in Europa machten eine andere Erfahrung, als sie den Zugang zu Exchange (EXO) und den anderen Haupt-Workloads verloren. Die Verfügbarkeit von Microsoft Teams war zuerst betroffen, gefolgt von OneDrive und SharePoint, und etwa eine Stunde später fiel EXO aus. Die Auswirkungen auf das Geschäft waren nicht so groß, da diese Ausfälle außerhalb der Geschäftszeiten stattfanden, verglichen mit den Ausfallzeiten in Nordamerika. Anhand der Daten in den nachstehenden Diagrammen können Sie sehen, dass alle M365-Dienste um 3:00 herum wieder verfügbar waren, mit einer geringfügigen Verfügbarkeit dazwischen.

Europa: Teams-Dienst Abbildung 1: Teams-Dienst
Abbildung 2: Exchange Online-Dienst
Abbildung 3: OneDrive-Dienst
Abbildung 4: SharePoint Online-Dienst

Hinweis:Obige Zeitstempel sind Mitteleuropäische Zeit (MEZ)

Investieren Sie in ein Frühwarnsystem

Ausfälle von M365 werden immer wieder vorkommen, das hat sich im Laufe der Zeit gezeigt. Wie Ihre IT-Support-Gruppen in diesen unvorhersehbaren Fällen reagieren können, hängt von Ihnen ab. Für einige Unternehmen ist diese Art von Ausfallzeit geschäftskritisch. Sie benötigen detaillierte Informationen, damit sie die besten Entscheidungen für ihre Mitarbeiter und Partner treffen können. Wenn sie wissen, welche M365-Dienste betroffen sind, können sie proaktiv arbeiten, die Endanwender benachrichtigen und Notfallpläne anwenden, bevor sie mit Helpdesk-Anrufen überschwemmt werden:

  • Informieren Sie Ihren Helpdesk, um detaillierte Anweisungen vorzubereiten
  • Wechseln Sie während des Ausfalls zu anderen Kommunikationsmethoden
  • Verschieben Sie Termine auf den nächsten Tag
  • Informieren Sie Geschäftspartner und Kunden, dass sie mit verzögerten Mitteilungen rechnen müssen

Mehr herausfinden...

Wenn Sie mehr über unsere erfahren möchten OfficeExpert EPM data analytics Lösung und wie sie Ihnen helfen kann, die Serviceverfügbarkeit zu überwachen und die Geschäftskontinuität für Ihre Mitarbeiter aufrechtzuerhalten, besuchen Sie bitte unsere Übersichtsseite unter https://www.panagenda.com/products/officeexpert/.

Kommentare (Keine Kommentare)

Hinterlassem Sie einen Kommentar

Weitere Informationen finden Sie in unserem Datenschutzerklärung.