O que podemos aprender com a British Airways

Centenas de voos foram atrasados ou cancelados quando o backup falhou após falha de energia no Data Center da companhia, no dia 27 de maio.

Nos últimos dias acompanhamos nos noticiários uma dos mais estranhos caso de falhas da tecnologia, centenas de aviões da British Airways parados em um dos maiores aeroporto do mundo na Inglaterra, o Heathrow Airport, evido a um surto de  energia em um dos Data Centers da companhia.

A surpresa é que , dado a importância e tamanho da empresa, espera-se que exista um bom Plano de Continuidade e Data Center alternativo de alta disponibilidade, mas segundo o assessor de imprensa da British Airways “O problema foi devido a uma surto de energia no Data Center de U.K. Foi uma falha excepcional que causou danos físicos a infraestrutura e resultou em uma falha generalizada na complexa tecnologia da companhia”

A pergunta que fica é: Não existe sistema backup ?

Segundo o Assessor, a Britsh Airway conta com sistemas de backup, porém estes também falharam nesta ocasião. Embora a British Airways tenha mais de um Data Center, a sobrecarga de energia afetou os dois Data Centers da empresa, o que é inaceitável sob o ponto de vista de Segurança.

Estima-se que o problema tenha gerado, entre reembolsos, multas e imagem alguns milhões de Dólares de prejuízo para a companhia, que levará ainda algum tempo para se recuperar completamente dos efeitos da crise.

Como lição podemos refletir sobre a construção dos Planos de Contingência e Continuidade de Negócios, avaliando até que ponto estamos vulneráveis em nossa companhias, até que ponto estamos ignorando os chamados “single point of failures” (pontos únicos de falhas). Igualmente se temos construído e realizados adequadamente os teste e validação dos Planos de Contingência e Continuidade.

O que tenho visto e presenciado ao longo destes quase 30 anos de atuação na área de tecnologia (27 em Segurança da Informação), é que as empresas preocupam-se com o desastre somente após sua ocorrência, algumas procuram se antecipar criando Planos de Contingência, mas ignoram os Planos de Continuidade. Outras criam os planos, mas ignoram investimentos relevantes para eliminação dos pontos únicos de falhas, acreditando que somente um sistema de duplicação local de equipamentos são suficientes. Critérios como distância entre data center, alimentação isolada de energia (incluindo rotas e provedores de energia), são constantemente ignorados ou relevados a segundo plano.

A falha da Britsh Airways nos mostra que quanto mais complexa é a operação de IT maior deve ser a preocupação com estes “detalhes” e que relevar investimentos para a construção de uma infraestrutura robusta e realmente independente e de alta disponibilidade,  pode custar muito mais aos cofres da empresa do que se imagina. Na realidade o “barato sai muito caro”.

 

por MindSec

 

About mindsecblog 294 Articles

Blog patrocinado por MindSec Segurança e Tecnologia da Informação Ltda.