Temperatura tira do ar Data Center da Azure

Temperatura tira do ar Data Center da Azure . Na semana passada a Microsoft admitiu que clientes enfrentaram problemas para se conectarem em sua plataforma de nuvem Azure.

O comunicado, emitido dia 04 de setembro, dizia que clientes do “centro sul dos EUA” haviam sido afetados, porém notícia publicada pelo site Convergência Digital apurou que a falha trouxeram insatisfação no mercado e colocaram dúvidas sobre a estratégia do governo federal de contratar uma única provedora de serviços de nuvem.

O comunicado, reproduzido em português abaixo cita que “os engenheiros continuam a avaliar qualquer impacto residual e qualquer cliente que ainda esteja sofrendo impacto será comunicado por meio de seu portal de gerenciamento, pois os engenheiros permanecem engajados para determinar a causa raiz completa” e embora o texto finalize com o prazo de 48 horas, até o momento não foi divulgado no site a causa real do problema, que a princípio foi gerado por uma problema climático que sobrecarregou o sistema de resfriamento do Data Center, causando o aquecimento dos equipamentos, que por segurança se auto-desligaram.

Segundo comentário do Convergência Digital o mercado assume estas falhas como inerentes ao risco de uma plataforma centralizada em nuvem.

Desta forma a estratégia de nuvem deve ser muito bem estudada e planejada, incluindo os conceitos e providências definidas no Plano de Continuidade de Negócios da empresa.

O Banco Central em 26 de Abril  lançou a Resolução BACEN 4658 sobre Política Cibernética e uso de Cloud que exige, entre outras coisa providência e controles formais sobre os provedores de serviços em nuvem, que neste caso o tremo “nuvem” é entendido como qualquer provedor de serviço externo, e um correto e atualizado Plano de Continuidade de Negócios, com teste que comprovem a sua eficácia e a alternância entre sites distantes fisicamente, o que mitigaria o problema ocorrido na Azure

Comunicado da Microsoft:

Múltiplos Serviços – Mitigados
Resumo do impacto: Entre 09:29 UTC em 04 de setembro de 2018 e 08:40 UTC em 07 de setembro de 2018 (aprox.), Um subconjunto de clientes no centro-sul dos EUA pode ter tido dificuldades para se conectar a recursos hospedados nessa região. Vários serviços do Azure podem ter sofrido interrupção do serviço devido ao atraso na recuperação de contas de armazenamento. Serviços não regionais, como o Active Directory do Azure, o Visual Studio Team Services e o Azure Resource Manager, também podem ter sofrido impacto.
Causa preliminar: Um evento climático grave, incluindo raios, ocorreu perto de um datacenter do centro-sul dos EUA. Isso resultou em flutuações de tensão de energia que afetaram os sistemas de resfriamento do datacenter. Procedimentos automatizados para garantir a integridade dos dados e do hardware entraram em vigor e o hardware crítico entrou em um processo estruturado de desligamento.
Mitigação: os engenheiros seguiram a estratégia de mitigação descrita abaixo:
1) Energia restaurada para o datacenter do centro-sul dos EUA
2) Balanceadores de carga de software recuperados para unidades de escala do Armazenamento do Azure no Centro-Sul dos EUA
3) Unidades de escala Azure Storage impactadas e recuperadas no Centro-Sul dos EUA
4) Recuperou os serviços restantes dependentes do armazenamento no centro-sul dos EUA
Próximas etapas: os engenheiros continuam a avaliar qualquer impacto residual e qualquer cliente que ainda esteja sofrendo impacto será comunicado por meio de seu portal de gerenciamento, pois os engenheiros permanecem engajados para determinar a causa raiz completa. Isso será fornecido em aproximadamente 48 horas.

 

Novo comunicado sobre problema no AD

Independente do incidente do dia 04, a Microsoft também divulgou outro incidente ocorrido no dia 06 de setembro que comprometeu o serviço de Active Directory.  O comunicado diz que o problema ocorreu de forma intermitente e não detalha a extensão da falha. Para resolver o problema os engenheiros aplicaram um hotfix na plataforma. veja abaixo o incidente divulgado pela Microsoft.

Diretório ativo do Azure – várias regiões
Resumo do impacto: Entre 16:13 UTC em 06 de setembro de 2018 e 01:35 UTC em 07 de setembro de 2018, um subconjunto de clientes do Active Directory do Azure usando vários serviços pode ter passado por falhas de solicitação de autenticação intermitente ao se conectar a recursos.

Causa raiz preliminar: os engenheiros determinaram que uma tarefa de implantação recente impactava as instâncias de um serviço de back-end que se tornava insalubre, impedindo que as solicitações fossem concluídas.

Mitigação: os engenheiros implantaram um hotfix de plataforma para atenuar o problema.

Próximas etapas: os engenheiros continuarão investigando para estabelecer a causa raiz completa e evitar futuras ocorrências.

 

 

fonte: Convergência Digital & Microsoft 

Sobre mindsecblog 1772 Artigos
Blog patrocinado por MindSec Segurança e Tecnologia da Informação Ltda.

3 Trackbacks / Pingbacks

  1. Visão estratégica das Dimensões de Segurança na LGDP
  2. Aeroporto de Bristol (UK) é atingido por ransomware
  3. Vazam 14 milhões de registros da GovPayNow.com

Deixe sua opinião!