CrowdStrike, apagão global e a relação com qualidade de software

Matheus Franco

|

Analista de Growth

Atualizado em:

8/5/2026

Voltar à home do blog

19 de julho de 2024 ficará marcado como a data em que a tela azul do Windows se tornou o grande pesadelo do mundo conectado. Na madrugada desse dia, um defeito em uma atualização de conteúdo de um software da CrowdStrike, empresa norte-americana de segurança cibernética, ocasionou interrupções no funcionamento de inúmeros sistemas mundo afora, causando complicações como milhares de voos cancelados, suspensão de cirurgias, linhas de trem paradas e problemas bancários. Mas o que tudo isso tem a ver com qualidade de software?

Não importa o tamanho de uma empresa, ela não está imune a panes tecnológicas que podem prejudicar o usuário. Nesse episódio, o mundo parou por falta de investimento em testes de qualidade e processos rigorosos e ininterruptos de validação de softwares.

Nesse contexto, as organizações devem entender que a cultura de qualidade abrange muito mais do que apenas a experiência do usuário. Trata-se de garantir a segurança e prevenir a interrupção de sistemas críticos, como os de hospitais, aeroportos, serviços bancários e linhas de emergência, cujas falhas podem ter consequências graves na vida das pessoas. Com os sistemas cada vez mais integrados ao cotidiano, a qualidade de software não pode ser negligenciada nem tratada como uma preocupação exclusiva do setor de TI.

Entenda mais sobre Cultura de Qualidade

Porém, antes de discorrer mais sobre como o investimento em qualidade de software poderia prevenir os problemas que a CrowdStrike e o mundo enfrentaram com o apagão global, é preciso entender melhor o que aconteceu no dia 19 de julho.

Recapitulando o apagão global

A tela azul começou a aparecer na madrugada do dia 19 de julho. De imediato, um ataque hacker foi descartado e o CEO da CrowdStrike, George Kurtz, veio a público afirmar que a empresa estava “trabalhando ativamente com clientes afetados por um defeito encontrado em uma única atualização de conteúdo para hosts do Windows”.

A essa altura dos acontecimentos, milhares de voos foram cancelados ao redor do mundo. No Brasil, algumas companhias tiveram suas operações de check-in afetadas, causando alguns atrasos pontuais. No setor bancário, instituições brasileiras foram afetadas em diferentes escalas, como serviços do Bradesco, Banco do Brasil, Neon, Next e Banco Pan. Hospitais também enfrentaram dificuldades para efetuar alguns procedimentos e cirurgias, assim como emissoras de TV tiveram problemas em suas transmissões.

O que é a CrowdStrike?

A Crowdstrike, com sede em Austin, Texas (EUA), é uma empresa de segurança cibernética fundada há 13 anos, que hoje conta com quase 8.500 funcionários.

Um dos seus principais produtos é a plataforma CrowdStrike Falcon, lançada em 2011. Desde então, o Falcon tem sido amplamente utilizado por governos e grandes corporações, incluindo bancos globais, empresas de saúde e do setor de energia.

Entre os clientes mais conhecidos está a Microsoft, desenvolvedora do Windows, onde os principais impactos do apagão global foram sentidos.

A explicação da CrowdStrike para o apagão global

Cinco dias após o apagão global, a CrowdStrike emitiu um comunicado explicando que o incidente foi causado porque o Falcon Sensor, uma plataforma avançada que protege os sistemas contra softwares maliciosos e hackers, possuía uma falha que forçava os computadores com Windows a travar e reproduzir a tela azul.

“Devido a um bug no validador de conteúdo, uma das duas instâncias de modelo passou pela validação, apesar de conter dados de conteúdo problemáticos”, disse a CrowdStrike em um comunicado.

Apesar de não informar ao público quais seriam os dados de conteúdo, a CrowdStrike afirmou ter adicionado uma “nova verificação” ao seu processo de controle de qualidade em uma tentativa de evitar que o problema ocorra novamente.

Qualidade de software e o apagão global

Não seria preciso nem mesmo explicação formal da CrowdStrike atrelando o apagão a um bug e uma falha de qualidade de software. No mesmo dia 19 de julho, especialistas já especulavam sobre as causas do problema e as apostas foram bem sucedidas. 

Um dado divulgado pela Microsoft dá conta de que 8,5 milhões de dispositivos foram afetados em todo o mundo. Isso demonstra como as consequências quando se reduz o investimento em qualidade - ou se negligencia o tema - podem ser desastrosas.

Despriorizar qualidade de software é assumir riscos muito grandes, sejam eles financeiros e/ou de reputação de uma organização, uma vez que um colapso como o ocorrido em 19 de julho afeta milhares, milhões de pessoas.

Como proteger sua empresa de um apagão global como o da CrowdStrike - ou de causar um

Certamente, vai levar um tempo para tanto a CrowdStrike como as empresas atingidas se recuperarem do incidente. 

De acordo com a seguradora Parametrix, as companhias norte-americanas que integram a lista da Fortune 500, excluindo a Microsoft, enfrentarão 5,4 bilhões de dólares em perdas financeiras em virtude do apagão cibernético.

No entanto, nem sempre as perdas são causadas por incidentes gigantescos. Ao longo do tempo, empresas vão perdendo dinheiro, credibilidade e satisfação do cliente.

Paralelamente, o orçamento é sempre um desafio. Por isso, é importante, sim, não precisar aplicar todas as práticas de qualidade, mas algumas delas podem ajudar muito e representam uma boa gestão de risco.

Dicas práticas de qualidade de software

Duas práticas apoiam de maneira substancial a entrega contínua de qualidade, especialmente pensando em empresas que possuem produtos que estão continuamente sendo atualizados, como é o caso da CrowdStrike. São elas:

  • Tenha seus testes de regressão bem definidos e, se possível, automatizados;
  • SEMPRE considere tempo para testes e/ou outras práticas de qualidade ao longo do processo de desenvolvimento.

A importância dos testes de regressão

Empresas que mantêm seus produtos em constante evolução devem priorizar os testes de regressão. Essa prática, quando bem mapeada e atualizada, torna-se essencial.

Ao atualizar produtos digitais com novas funcionalidades, é crucial conhecer as jornadas e os caminhos do sistema. Dessa forma, ao introduzir uma novidade, os testes de regressão garantem que nenhuma área essencial seja comprometida ou colapsada, afetando outras partes do sistema.

Executar esse processo manualmente pode ser exaustivo, pois há centenas de cenários de teste a serem considerados, demandando muito tempo e pessoal. É aí que a automatização se destaca, agregando imenso valor ao processo.

Veja como aplicar a regressão na prática

Por que aplicar práticas de qualidade ao longo do processo de desenvolvimento

Quando ocorre um incidente, a pressão pode ser imensa e os danos, irreversíveis. Por isso, é crucial realizar testes continuamente ao longo de todo o ciclo de desenvolvimento de software.

Muitas empresas adotam um modelo ágil de desenvolvimento, utilizando períodos específicos, geralmente chamados de sprints. Durante esses intervalos, novas funcionalidades são desenvolvidas, mas é comum que não se reservem momentos adequados para a realização de testes.

Contudo, ao incluir testes ao longo das sprints, sejam eles unitários, de integração ou end-to-end, é possível garantir uma boa cobertura dentro do processo de desenvolvimento.

Começar por essas práticas pode significar, simplesmente, evitar um bug em produção. Em escala maior, pode impedir um apagão cibernético mundial. O quanto sua empresa irá investir em qualidade e valorizar esse tema é que vai determinar o resultado final dessa equação.

Não ignorar os processos e insistir em boas práticas de qualidade pode fazer a diferença em um momento de incidente, quando a pressão se torna descomunal e o dano já aconteceu. O alerta já foi dado no dia 19 de julho de 2024.

Matheus Franco

|

Analista de Growth

Especialista em Growth Marketing, Matheus compartilha sua experiência técnica em grandes projetos voltados à Qualidade através dos conteúdos do Blog da Sofist.

Leia mais

Blog Home
Contato
Topo