Como uma rede cai, a exemplo de Twitter, Facebook, WhatsApp?

Equipamento com defeito, temporais ou vendavais, ataques cibernéticos, necessidade de manutenção e muitas pessoas acessando uma mesma rede ao mesmo tempo, aleatória ou intencionalmente, são os principais motivos que fazem uma rede cair.

“Algo deu errado. Tente novamente mais tarde”, “Estamos com problemas”, “Não é possível estabelecer conexão”. Quem nunca se frustrou ao ver uma dessas frases no meio de uma pesquisa, de um trabalho ou de uma conversa? E ela é mais comum do que se imagina. Em um único dia pode haver mais de 40 casos de queda, com diferentes graus de gravidade, nas mais diversas redes: serviços em nuvem, e-mail, mídias sociais, streaming, jogos e navegadores de internet.

Esses problemas podem ser causados por um defeito em um equipamento, fenômenos climáticos (como um temporal ou vendaval que cause interrupção), danos acidentais, ataques cibernéticos com softwares maliciosos que contêm vírus ou mesmo algo simples como a necessidade de manutenção de rotina.

Outra causa frequente que derruba uma rede é o congestionamento. É quando por alguma razão muitas pessoas tentam ao mesmo tempo acessar a internet por uma mesma rede. Isso pode ocorrer aleatoriamente, provocado por um fato que leve muita gente a se conectar, ou intencionalmente, como num ataque.

Essas falhas afetam milhares de usuários em vários países num mesmo período. A boa notícia é que, apesar de causar transtornos e causar impaciência, em geral, os problemas são solucionados rapidamente. Ainda que para nós pareça uma eternidade.

No início de dezembro, um problema fez com que o WhatsApp ficasse fora do ar em vários países, incluindo o Brasil. Rapidamente, outras redes sociais começaram a ser inundadas por postagens com reclamações. Estima-se que a falha tenha afetado mais de 200 mil usuários. Ao que tudo indica, a falha foi provocada pelo rompimento de uma canalização que fornece água para as torres de resfriamento em data center da IBM.

Em novembro, uma queda nos serviços do YouTube gerou mais de 300 mil reclamações. Mesma quantidade registrada dias depois quando o serviço de streaming de vídeo do Google deixou sem acesso usuários na Austrália, França, Japão, Itália, Reino Unido e nos Estados Unidos. E, no mês anterior, a instabilidade afetou milhares de usuários do Twitter.

Como se vê, nenhuma rede ou serviço está livre de falhas, cuja ocorrência é geralmente detectada quando começam a aparecer postagens com reclamações ou perguntando se o serviço está fora do ar em outras redes. Outra forma de saber que há um problema são os sites de monitoramento.

Detecção de problemas em tempo real

Um dos mais conhecidos é o Downdetector. O site monitora mais de 6 mil serviços em 45 países e mostra em tempo real informações sobre os problemas no acesso. Sites como esse, em geral, identificam as falhas antes mesmo que os provedores dos serviços saibam que estão ocorrendo.

No relatório diário do site, é possível ver que há dezenas de falhas num único dia. É claro que nem todas afetam um número tão significativo de usuários. Algumas delas são problemas pontuais. Por isso, é necessária uma análise rigorosa, considerando principalmente a quantidade de países e pessoas afetadas num mesmo momento.

Outra plataforma para verificar se há uma queda é Google Trends, que monitora as buscas na internet. Se houver um problema, podemos ter certeza de que as pesquisas vão indicar isso. Em poucos minutos, buscas como “Twitter parou?”, “WhatsAPP caiu?”, “Facebook sem acesso” se multiplicam na página do Google e, certamente, dos outros navegadores.

Milhares de pessoas percebem imediatamente quando há uma falha significativa numa rede, já saber a causa do problema ainda é difícil. Ao serem alertados de que algo está errado pelos questionamentos dos usuários (e verificando que há uma falha significativa), os provedores rapidamente passam a informar que estão tomando providências. E, depois, informam que o problema foi resolvido sem mais detalhes.