in Blog, OfficeExpert, Produkte
Lesezeit 5 Min.

Letzte Woche sind mehrere Office 365 nutzende Unternehmen auf der gesamten Welt von einem Ausfall betroffen gewesen, bei dem der Exchange Online Dienst für mehrere Stunden nicht vollständig erreichbar war. Einige konnten nicht mehr auf ihre E-Mail-Postfächer zugreifen, während bei anderen die E-Mail Zustellung (senden/empfangen) nur sehr langsam lief.

Das kommt davon…

Die Folgen sind offensichtlich: veringerte Produktivität, ein schlechtes Nutzererlebnis, unzufriedene Nutzer, verlangsamte Geschäftsabläufe und Vertrauensverlust der Kunden, um nur einige der möglichen kritischen Konsequenzen zu nennen.

Interessanterweise wurde der Fall (EX172491), mittlerweile von Microsoft gelöscht.

Es ist weitreichend bekannt, dass mit der Nutzung von Cloud-Diensten gewisse Risiken einhergehen. Eine zentrale Frage bleibt stets: Wie gut ist Ihr Unternehmen auf einen solchen Fall vorbereitet? Oder in anderen Worten – was ist Ihr Notfallplan?

Dies ist eine fundamentale Frage für viele Anwender, Administratoren und Unternehmen, die täglich von stabilen und hoch performanten Cloud-Diensten abhängig sind.

Sein Sie auf der sicheren Seite

Die Überwachung Ihrer Office 365 Konfiguration ist ein erster wichtiger Schritt, um die notwendigen Informationen über Ihre Enterprise Anwendungen in Echtzeit zu erhalten. Es ist nicht möglich, einen solch zentralen und wichtigen Teil Ihrer Anwendungs-Infrastruktur effektiv zu verwalten und steuern, solange Sie nicht über dessen aktuelle Performance informiert sind. Frühe Einblicke in die Erreichbarkeit helfen Ihnen, auf Ausfälle vorbereitet zu sein.

Zu wissen, wer genau betroffen ist, stellt einen wichtigen Punkt zur Problembehebung dar, beispielsweise für die gezielte Benachrichtigung der Endnutzer. Zu Wissen, ob nur ein Teil der Nutzer betroffen ist oder eine bestimmte Region (falls Multi-Geo Funktionen von Office 365 genutzt werden) oder das gesamte Unternehmen, ist hier ein wesentlicher Aspekt.

Mit OfficeExpert bieten wir eine Lösung an, die Ihnen dabei hilft, die Ausmaße eines möglichen Ausfalls aktiv abschätzen zu können. Außerdem hätten Unternehmen durch den Einsatz des OfficeExpert Mail Flow Simulation Sensors herausfinden können, dass das System zwar teilweise wiederhergestellt wurde (funktionierender Zugriff auf das Postfach) aber der grundlegende Dienst zum Senden und Empfangen von Mails durch den Vorfall immer noch beeinträchtigt war. Der folgende Screenshot zeigt einen stetigen Anstieg der E-Mail Sendezeit zwischen dem 23. und 26. Januar.

Gewährleisten Sie eine stetige Business Continuity für Ihre Endnutzer

Sich solch einen Durchblick zu verschaffen, hilft Ihnen und schlussendlich auch den Endnutzern zu verstehen, dass ein bestimmter Dienst noch nicht vollständig wiederhergestellt ist, und Sie dementsprechend planen und kommunizieren können. Benachrichtigungen zu überwachen stellt sicher, dass Sie als Erstes über Probleme informiert sind, lange bevor Microsoft einen Tweet absetzt. Zu wissen, welche Dienste betroffen sind, ermöglicht ihnen aktiv zu werden und beispielsweise Ihre Nutzer rechtzeitig zu informieren sowie Maßnahmen einzuleiten bevor Sie mit Nutzertickets überflutet werden.

Testen Sie unsere OfficeExpert Sandbox und entdecken Sie sämtliche Vorteile. OfficeExpert ist Ihr Schlüssel zu Business Continuity.

Zur Sandbox

UPDATE: Weiterer Ausfall am 29. Januar!

Erstaunlich! Am 29. Januar 2019 trat schon wieder ein weiterer Vorfall auf. Während der Zeit konnten Benutzer sich nicht authentifizieren und auf Office 365-Dienste zugreifen. Die Grundursache, die von Microsoft mitgeteilt wurde, war ein DNS-Problem mit CenturyLink als internem DNS-Anbieter.

Der folgende Screenshot zeigt, wie OfficeExpert diesen Ausfall gemessen und berichtet hat. Der Skype for Business Service hatte fast eine Ausfallzeit von mehr als 3 Stunden, während andere Dienste wie Exchange Online für etwa 1 Stunde betroffen waren. Die Fehleranzeige (Fehlermeldung im Screenshot) besagt, daß ein bestimmter voll qualifizierter Domänenname nicht aufgelöst werden konnte. Dies entspricht genau der von Microsoft genannten Ursache.

O365 outage 2. Mai!

„Wir kennen und untersuchen ein Problem, das den Zugriff auf SharePoint und OneDrive betrifft. Weitere Details finden Sie im Admin-Center unter SP178746 und OD178975.“ Diese Nachricht verschickte Microsoft am 2. Mai um 22:10 Uhr MEZ (13:10 Uhr PST).

Für alle Betroffenen gab es zuerst keine offizielle Bestätigung oder genauere Informationen zum Ausfall. Für Benutzer auf der ganzen Welt war Social Media die einzige Quelle, um mehr über die Probleme zu erfahren. Wie sich herausstellte, waren wichtige Kernprodukte wie Microsoft Azure, mehrere Office 365 Dienste, Dynamics und DevOps von der Störung betroffen.

panagenda OfficeExpert Kunden wussten bereits um 21:50 Uhr MEZ, ganze 20 Minuten vor der ersten Stellungnahme seitens Microsoft, über den Ausfall Bescheid, wie im folgenden Screenshot zu sehen ist:*

Unsere Kunden konnten umgehend reagieren und waren nicht auf offizielle Meldungen von Microsoft oder auf Informationen aus sozialen Netzwerken angewiesen. OfficeExpert erkannte den Ausfall sofort und auch welche Dienste davon betroffen waren. Details, die panagenda Kunden sehr zu schätzen wussten.

Wie auch beim letzten globalen Azure-Ausfall im Januar, als es über eine Stunde dauerte, bis die Office 365-Dienste wiederhergestellt waren, hatten OfficeExpert Kunden einen entscheidenden Vorteil. Solche Cloud-Ausfälle stellen Unternehmen immer wieder vor die Frage, wie Sie die Auswirkungen auf ihr Unternehmen am besten minimieren können.

Mehr zu diesem Thema erfahren Sie in unserem Whitepaper. Deutschsprachigen Lesern sei ans Herz gelegt, sich auch das Webinar mit MVP Michael Greth und Stefan Fried über die Vorgehensweise bei einem Cloud-Ausfall anzuschauen.

* nach öffentlich zugänglichen Quellen

Related Posts


Kommentar hinterlassen

Start typing and press Enter to search

panagenda WebshopChristoph Adler - SPS Bremen