AKTUALISIEREN! Weiterer Ausfall am 2. Mai!

Letzte Woche waren mehrere Organisationen auf der ganzen Welt von einem Office 365-Ausfall betroffen. Der Exchange Online-Dienst war mehrere Stunden lang nicht vollständig verfügbar. Einige konnten nicht auf ihre Postfächer zugreifen und für einige war die Leistung der E-Mail-Zustellung (Senden/Empfangen) einfach schlecht.

Huch! Da ist es…

Die Folgen sind offensichtlich. Produktivitätsverlust, schlechte Endbenutzererfahrung, verstärkte Endbenutzerfrustration, Verlust der Geschäftsgeschwindigkeit und Vertrauensverlust. Und das sind nur einige der vielen möglichen geschäftskritischen Auswirkungen.

Microsoft 365 Ausfallkarte (Quelle: Downdetektor)

Interessanterweise wurde der Fall, unter dem dieser Vorfall protokolliert wurde (EX172491), von Microsoft inzwischen entfernt.

Wir alle wissen, dass immer ein gewisses Risiko besteht Cloud-Services werden verwendet. Eine zentrale Frage bleibt jedoch immer: Wie gut sind Sie vorbereitet, wenn Ihrer Organisation so etwas passiert? Oder anders gesagt – Was ist dein Backup-Plan?

Tatsächlich eine grundlegende Frage für viele Endbenutzer, Administratoren und Unternehmen, die täglich auf stabile, leistungsstarke Cloud-Angebote angewiesen sind.

Gehen Sie auf Nummer sicher

Die Überwachung Ihrer Office 365-Installation ist ein wichtiger erster Schritt, um in Echtzeit die Informationen zu Ihren Unternehmensanwendungen zu erhalten, die Sie benötigen. Sie können einen äußerst wichtigen Teil Ihrer Anwendungsinfrastruktur nicht effektiv verwalten, wenn Sie nicht wissen, wie sie funktioniert. Früh insights nach Verfügbarkeit hilft Ihnen bei der Vorbereitung auf Ausfälle.

Zu wissen, wer betroffen ist, ist ein wichtiges Element zur Steuerung des Problems (z. B. Benachrichtigung Ihrer Endbenutzer). Ob nur eine Gruppe von Personen, eine Teilmenge von Benutzern (falls Multi-Geo-Funktionen von Office 365 verwendet werden) oder die gesamte Organisation, die den Cloud-Mandanten verwendet.

Mit der OfficeExpert Wir bieten eine Lösung, die Ihnen hilft, das Ausmaß der möglichen Auswirkungen zu erkennen.

Durch den Einsatz des Mail Flow Simulation Sensor by OfficeExpert, hätten Organisationen erkennen können, dass das System irgendwie wiederhergestellt wurde (der Zugriff auf das Postfach funktionierte wieder). Sie hätten auch erkennen können, dass der zugrunde liegende Dienst des Versendens/Empfangens von Mails durch den Vorfall noch beeinträchtigt war. Der folgende Screenshot zeigt, dass die Mail-Zustellzeit zwischen dem 23. und 26. Januar stetig zunahm.

Ausfallmuster (Quelle: OfficeExpert)

Stellen Sie eine solide Geschäftskontinuität für Ihre Endbenutzer sicher

Diese Transparenz hilft Ihnen zu wissen, dass ein bestimmter Dienst nicht vollständig wiederhergestellt ist. Es hilft Ihnen auch zu verstehen, wie Sie entsprechend planen und kommunizieren können. Davon profitiert am Ende natürlich auch der Endverbraucher.

Die Überwachung von Benachrichtigungen stellt sicher, dass Sie als erster feststellen, dass ein Problem vorliegt. Noch bevor Microsoft Stunden später darüber twittert. Wenn Sie wissen, welche Dienste betroffen sind, können Sie proaktiv arbeiten, indem Sie Ihre Benutzer benachrichtigen und Notfallpläne anwenden, bevor Sie mit Benutzertickets überschwemmt werden.

UPDATE: Weiterer Ausfall am 29. Januar!

Ein weiterer größerer Ausfall ereignete sich am 29. Januar 2019, bei dem Benutzer sich nicht authentifizieren und auf Office 365-Dienste zugreifen konnten. Azure war auch von diesem Vorfall betroffen. Die von Microsoft mitgeteilte Ursache war ein DNS-Problem mit CenturyLink als internem DNS-Anbieter.

Der folgende Screenshot zeigt, wie OfficeExpert hat diesen Ausfall gesehen und gemessen. Der Skype for Business Service hatte eine Ausfallzeit von fast 3 Stunden. Andere Dienste wie Exchange Online waren für etwa 1 Stunde betroffen. Die Fehleranzeige (Fehlermeldung im Screenshot) besagt, dass ein bestimmter vollqualifizierter Domänenname nicht aufgelöst werden konnte. Dies stimmt genau mit der Root-Cause-Aussage von Microsoft überein.

Office 365-Ausfall 29. Januar 2019 (Quelle: OfficeExpert)

UPDATE: O365 Ausfall am 2. Mai!

Am 2. Mai um 10:10 Uhr MESZ (1:10 Uhr PST) verschickte Microsoft die folgende Nachricht: Uns ist ein Problem bekannt, das den Zugriff auf SharePoint und OneDrive betrifft, und wir untersuchen es. Weitere Details finden Sie im Admin Center unter SP178746 und OD178975.

Microsoft konnte zunächst keine Informationen an seine community. Nutzer weltweit waren gezwungen, sich an die Gerüchteküche in den sozialen Medien zu wenden, um herauszufinden, warum sie Probleme hatten. Kerndienste, die sich negativ auf die Produktivität auswirkten, enthalten Azuremehrere Microsoft 365 Dienste, Dynamik und DevOps.

Im Screenshot unten ist zu sehen, dass OfficeExpert um 9:50 Uhr MESZ einen Ausfall festgestellt. Das war voll 20 Minuten bevor die erste Microsoft-Kommunikation gesendet wurde.*

Sharepoint, Azure, Office 365-Ausfall Mai. 2, 2019 (Quelle: OfficeExpert)

Wir freuen uns sehr über das positive Feedback, das wir von unseren Kunden erhalten haben OfficeExpert. Sie waren in der Lage, den weltweiten Ausfall zugehöriger Teildienste für sich zu identifizieren, bevor er öffentlich bekannt wurde.

Das war wie die globale Azure Januar aus, als die Wiederherstellung der Office 1-Dienste über 365 Stunde dauerte. Auch hier stellt sich die Frage, wie Sie die Auswirkungen von Cloud-Ausfällen auf Ihr Unternehmen am besten minimieren können.

Mehr zu diesem Thema lesen Sie in unserem white paper. Deutschsprachige könnten auch daran interessiert sein, die webinar mit MVP Michael Greth und Stefan Fried was bei einem Cloud-Ausfall zu tun ist.

* laut öffentlich zugänglichen Quellen