Na semana passada, várias organizações em todo o mundo foram afetadas por uma interrupção do Office 365. O serviço Exchange Online não estava totalmente disponível por várias horas. Alguns não conseguiam acessar suas caixas de correio e, para alguns, o desempenho de entrega de e-mail (envio/recebimento) era apenas ruim.

Uau! Aí está…

As consequências são óbvias. Perda de produtividade, experiência ruim do usuário final, frustração amplificada do usuário final, perda de velocidade dos negócios e perda de confiança. E isso é apenas para citar alguns dos muitos possíveis impactos críticos para os negócios.

Microsoft 365 mapa de interrupção (Fonte: Downdetector)

Curiosamente, o caso em que esse incidente foi registrado (EX172491) foi removido pela Microsoft nesse meio tempo.

Todos sabemos que existe um certo risco sempre que serviços na nuvem são usados. No entanto, uma questão-chave sempre permanece – Quão bem você está preparado se algo assim acontecer com sua organização? Ou em outras palavras – Qual é o seu Plano B?

De fato, uma questão fundamental para muitos usuários finais, administradores e empresas que dependem de ofertas de nuvem estáveis ​​e de alto desempenho diariamente.

Dê um passeio no lado seguro

Monitorar sua instalação do Office 365 é uma primeira etapa crítica para obter as informações de que você precisa em seus aplicativos corporativos em tempo real. Você não pode gerenciar com eficiência uma parte de vital importância de sua infraestrutura de aplicativos a menos que saiba como ela está funcionando. Cedo insights na disponibilidade irá ajudá-lo a se preparar para interrupções.

Saber quem é afetado é um elemento importante para direcionar o problema (por exemplo, notificar seus usuários finais). Seja apenas um grupo de pessoas, um subconjunto de usuários (caso sejam usados ​​recursos multigeográficos do Office 365) ou toda a organização usando o locatário de nuvem.

Com o OfficeExpert oferecemos uma solução que ajuda você a identificar a magnitude do possível impacto.

Além disso, usando o sensor de simulação de fluxo de mensagens OfficeExpert, as organizações podem ter visto que o sistema foi restaurado de alguma forma (acessar a caixa de correio funcionou novamente). Eles também poderiam ter visto que o serviço subjacente de envio/recebimento de e-mails ainda estava prejudicado pelo incidente. A captura de tela a seguir mostra que houve um aumento constante no tempo de entrega de e-mails entre 23 e 26 de janeiro.

Padrão de interrupção (Fonte: OfficeExpert)

Garanta uma sólida continuidade de negócios para seus usuários finais

Essa transparência ajuda você a saber que um determinado serviço não foi totalmente restaurado. Também ajuda você a entender como planejar e se comunicar adequadamente. No final das contas, isso naturalmente também beneficia o usuário final.

As notificações de monitoramento garantem que você seja o primeiro a descobrir que existe um problema. Mesmo antes de a Microsoft twittar sobre isso horas depois. Saber quais serviços são afetados permite que você trabalhe de forma proativa, notificando seus usuários e aplicando planos de contingência antes de ser inundado com tíquetes de usuários.

ATUALIZAÇÃO: Interrupção adicional em 29 de janeiro!

Outra grande interrupção aconteceu em 29 de janeiro de 2019, onde os usuários não conseguiram autenticar e acessar os serviços do Office 365. Azure também foi afetado por este incidente. A causa raiz que foi comunicada pela Microsoft foi um problema de DNS com a CenturyLink como um provedor de DNS interno.

A captura de tela a seguir mostra como OfficeExpert viu e mediu essa interrupção. O serviço Skype for Business teve um tempo de inatividade de quase 3 horas. Outros serviços, como o Exchange Online, foram impactados por cerca de 1 hora. O indicador de falha (mensagem de erro na captura de tela) informa que um determinado nome de domínio totalmente qualificado não pôde ser resolvido. Isso corresponde exatamente à declaração de causa raiz da Microsoft.

Interrupção do Office 365 em 29 de janeiro de 2019 (Fonte: OfficeExpert)

ATUALIZAÇÃO: Interrupção do O365 em 2 de maio!

Em 2 de maio, às 10h10 CEST (1h10 PST), a Microsoft enviou a seguinte mensagem: Estamos cientes e investigando um problema que afeta o acesso ao SharePoint e ao OneDrive. Mais detalhes podem ser encontrados no centro de administração em SP178746 e OD178975.

No início, a Microsoft não conseguiu obter nenhuma informação para seus community. Usuários em todo o mundo foram forçados a recorrer aos boatos de mídia social para descobrir por que estavam tendo problemas. Os principais serviços que afetaram negativamente a produtividade incluíram Azure, múltiplo Microsoft 365 serviços, Dinâmica e DevOps.

Na captura de tela abaixo, pode-se ver que OfficeExpert identificou uma interrupção às 9h50 CEST. Este foi um cheio 20 minutos antes do envio da primeira comunicação da Microsoft.*

SharePoint, Azure, Interrupção do Office 365 May. 2, 2019 (Fonte: OfficeExpert)

Estamos muito satisfeitos com o feedback positivo que recebemos de nossos clientes usando OfficeExpert. Eles foram capazes de identificar a interrupção global de sub-serviços relacionados por conta própria antes que ela se tornasse pública.

Era como o mundo Azure interrupção em janeiro, quando levou mais de 1 hora para os serviços do Office 365 serem restaurados. Novamente levantando a questão de como minimizar o impacto das interrupções na nuvem em seus negócios.

Você pode ler mais sobre esse assunto em nosso white paper. Os falantes de alemão também podem estar interessados ​​em ouvir o webinar com MVP Michael Greth e Stefan Fried sobre o que fazer durante uma interrupção na nuvem.

* de acordo com fontes publicamente disponíveis