in Blog, Noch mehr, OfficeExpert, panagenda news

Lesedauer: 4 Minuten

Letzte Woche war ein absoluter Alptraum für die Cloud-Dienste von Microsoft. Mit mehreren Systemausfällen, verursacht durch Azure AD-Probleme, die Microsoft 365 in die Knie zwangen, gefolgt von Load-Balancing-Problemen für Exchange online ein paar Tage später, zeigte die Microsoft Cloud-basierte Kollaborationsumgebung ihre mangelnde Belastbarkeit für IT-Komplexität.

Wie Microsoft wenige Stunden nach Beginn der Ausfallzeit meldete, „… um ca. 19:15 UTC am 15. März 2021 kann es bei einer Gruppe von Kunden zu Problemen bei der Authentifizierung in Microsoft-Diensten kommen, einschließlich Microsoft Teams, Office und/oder Dynamics, Xbox Live und dem Azure-Portal“, heißt es auf der Statusseite von Azure.

Und dann, ein paar Tage später, traf ein zweiter Vorfall die Microsoft-Cloud-Infrastruktur, der Exchange Online aufgrund von Load-Balancing-Problemen beeinträchtigte.

Dies waren NICHT die ersten Ausfälle in der Cloud-Umgebung von Microsoft, und es werden auch nicht die letzten sein. Was können Unternehmen tun, um ihre Reaktionszeit zu verbessern, wenn der nächste Ausfall kommt?

Lessons Learned – auf einen regnerischen Tag vorbereitet sein

Microsofts typische Reaktion auf einen Service-Ausfall ist das Versenden von Ankündigungen über Twitter und andere Kommunikationswege mit allgemeinen Informationen über das Problem. Es gibt selten einen Hinweis auf die Auswirkungen auf die Unternehmen, die in verschiedenen Regionen gehosted werden. Stattdessen werden Unternehmen beim Auftreten solcher Ausfälle auf der Suche nach Antworten im Stich gelassen und gebeten, sich später wieder zu melden.

Zu ihrer Verteidigung sei gesagt, dass Microsoft während des Ausfalls gute laufende Statusmeldungen zur Verfügung stellt, aber die Details sind immer noch sehr allgemein gehalten, sodass die Kunden auf sich selbst gestellt sind.

Also, was wäre, wenn? Was wäre, wenn Sie ein Frühwarnsystem hätten? Was wäre, wenn Ihre IT-Abteilung über Warnmeldungen verfügen würde, die die Details des Ausfalls enthalten, einschließlich der Information, WELCHE Arbeitsplätze und WELCHE Regionen aktuell betroffen sind? Mit diesen Informationen könnten Sie Maßnahmen ergreifen, das Support-Team des Helpdesk benachrichtigen und Ihre Mitarbeiter informieren, damit sie ihre Teams Meetings verschieben können.

Während der jüngsten M365-Ausfälle hatten unsere Kunden, die OfficeExpert EPM verwenden, diese Möglichkeit. Sie hatten die Warnung schon vor der Ankündigung von Microsoft und konnten die verwertbaren Erkenntnisse zu ihrem Vorteil nutzen.

OfficeExpert EPM und die regionalen Ausfallsunterschiede

Während die meisten Dienste in Nordamerika ausgefallen waren, stellten unsere Kunden fest, dass Exchange online nicht betroffen war (siehe Screenshots unten). Und da Exchange noch funktionierte, forderte ihr Supportteam ihre Mitarbeiter auf, ihre Teams Meetings auf den nächsten Tag zu verschieben und jegliche Verwirrung bei Partnern und Kunden zu umgehen.

Insgesamt gab es Unterschiede bei den Auswirkungen der Serviceverfügbarkeit von M365 in Abhängigkeit von Ihrer geografischen Region. OfficeExpert EPM identifizierte diese und versorgte unsere Kunden mit den Details 30 Minuten bevor Microsoft die ersten Ankündigungen verschickte.

Nordamerikanische Perspektive

Die folgenden 4 Screenshots stammen von unseren nordamerikanischen Kunden, die OfficeExpert EPM einsetzen. Sie können sehen, dass der Ausfall keine Auswirkungen auf den Exchange Online (EXO) Dienst hatte, aber die anderen Dienste wie Teams, OneDrive und SharePoint waren für Stunden komplett außer Betrieb.

Hinweis: Die obigen Zeitstempel sind östliche US-Zeit (ET)

Europäische Perspektive

Unsere Kunden in Europa machten eine andere Erfahrung, da sie den Zugriff auf Exchange (EXO) sowie die anderen wichtigsten Workloads verloren. Die Verfügbarkeit von Microsoft Teams war zuerst betroffen, gefolgt von OneDrive und SharePoint, und etwa eine Stunde später fiel EXO aus. Die Auswirkungen auf das Tagesgeschäft waren nicht so groß, da diese Ausfälle im Vergleich zu den Ausfallzeiten in Nordamerika außerhalb der Geschäftszeiten stattfanden. Anhand der Daten in den nachstehenden Grafiken können Sie erkennen, dass die M365-Dienste gegen 3:00 Uhr morgens alle wieder verfügbar waren, mit einer geringeren Verfügbarkeit dazwischen.

Hinweis: Obige Zeitstempel sind mitteleuropäische Zeit (MEZ)

Investieren Sie in ein Frühwarnsystem

Ausfälle von M365 werden wieder vorkommen, so viel ist im Laufe der Zeit bewiesen worden. Wie Ihre IT-Support-Teams während dieser unvorhersehbaren Fälle reagieren können, liegt an Ihnen. Für einige Unternehmen ist diese Art von Ausfallzeit kritisch für ihr Geschäft. Sie benötigen die detaillierten Informationen, damit sie die besten Entscheidungen für ihre Mitarbeiter und Partner treffen können. Wenn sie wissen, welche M365-Dienste betroffen sind, können sie pro-aktiv arbeiten, Endbenutzer benachrichtigen und Notfallpläne anwenden, bevor sie mit Helpdesk-Anrufen überschwemmt werden:

  • Alarmieren Sie Ihren Helpdesk, um detaillierte Anweisungen vorzubereiten
  • Wechseln Sie während des Ausfalls zu anderen Kommunikationsmodi
  • Verschieben Sie Meetings auf den nächsten Tag
  • Informieren Sie Geschäftspartner und Kunden, dass sie mit verzögerter Kommunikation rechnen müssen
  • Etc.

Find Out More…

 

Wenn Sie mehr über unsere Datenanalyselösung OfficeExpert erfahren möchten und wie sie Ihnen bei der Überwachung der Service-Verfügbarkeit und der Aufrechterhaltung der Business Continuity für Ihre Mitarbeiter helfen kann, besuchen Sie bitte unsere Übersichtsseite unter https://www.panagenda.com/produkte/officeexpert/.

Related Posts


Kommentar hinterlassen

Start typing and press Enter to search

business person walking up a staircase