O tempo de inatividade pode prejudicar a ideia de que a infraestrutura em nuvem é confiável e pronta para lidar com migrações de aplicativos de data centers físicos. Também pode ter implicações importantes para os negócios. AWS tem milhões de clientes e é uma extensão provedor líder No mercado.

A AWS se desculpou pelo impacto da interrupção em seus clientes.

Sites populares e serviços off-line usados ​​com frequência, incluindo Disney +, Netflix e Ticketmaster, foram desativados. Aspiradores Roomba, câmeras de segurança do Amazon’s Ring e outros dispositivos conectados à Internet, como latas de lixo inteligentes e ventiladores de teto conectados a aplicativos, também foram removidos devido a uma queda de energia.

As operações de varejo da Amazon foram paralisadas em alguns dos bolsos de aplicativos internos dos EUA usados ​​pelos depósitos da Amazon e sua força de trabalho de entrega depende da AWS, então a maioria dos funcionários na terça-feira não conseguiu inspecionar pacotes ou acessar métodos de entrega. Os vendedores externos também não podem acessar um site usado para gerenciar pedidos de clientes.

Durante a interrupção, a AWS tentou manter os clientes cientes do que estava acontecendo, mas a nuvem teve problemas para atualizá-los Página de status, conhecido como Service Health Dashboard.

“Como o impacto sobre os serviços durante este evento se originou de uma única causa raiz, optamos por fornecer atualizações por meio de um banner global no painel de integridade do serviço, o que, desde então, aprendemos que está dificultando para alguns clientes encontrar informações sobre isso problema ”, disse a AWS.

Além disso, os clientes não conseguiam criar casos de suporte por sete horas durante a interrupção.

A AWS disse que agora está tomando medidas para resolver esses dois problemas.

“Esperamos lançar uma nova versão do Service Health Dashboard no início do próximo ano, o que tornará mais fácil entender o impacto do serviço e uma nova arquitetura de sistema de suporte que está trabalhando ativamente em várias regiões da AWS para garantir que não haja atrasos no comunicar-se com os clientes ”, disse a AWS.

Esta não é a primeira vez que a AWS mudou a forma como os problemas são relatados.

Em 2017, uma interrupção que atingiu o popular serviço de armazenamento AWS S3 impediu os engenheiros de mostrar a cor apropriada para indicar o tempo de atividade no painel de integridade do serviço. A Amazon postou banners e acessou o Twitter para postar novas informações.

“Mudamos o console de gerenciamento SHD para funcionar em várias regiões da AWS”, disse a Amazon. Mensagem sobre esse episódio.

