O fracasso do Facebook mostra por que não devemos confiar nele para tudo

click fraud protection

Principais vantagens

  • Os problemas técnicos do Facebook foram lamentáveis, mas o problema provavelmente teria sido resolvido muito mais rápido se não dependesse de tantos sistemas interconectados.
  • Não há como evitar completamente as falhas do sistema, mas existem maneiras de torná-las menos prováveis.
  • Ter planos de backup para quando (não se, quando) um sistema falhar pode fazer a diferença entre 'irritante' e 'catastrófico'.
Um ícone de polegar para baixo em uma tecla preta do teclado.

fongfong2 / Getty Images

O recente desastre do Facebook demonstra como os sistemas interconectados estão fadados ao fracasso e por que não devemos usá-los para tudo.

Perder Facebook, WhatsApp e Instagram por várias horas na segunda-feira era inconveniente, prejudicial para as empresase, em alguns casos, quase catastrófico. De acordo com o Facebook, foi tudo devido a mudanças de configuração para seus roteadores de coordenação de rede.

É uma explicação razoável, mas o fato de que um único erro como esse poderia fazer com que não apenas o Facebook, mas outros sistemas de propriedade do Facebook parassem é um pouco alarmante.

Uma alteração errada na configuração do roteador fez com que vários serviços, e até mesmo fones de ouvido de RV, parassem de funcionar completamente. Além disso, como o próprio Facebook admite, também teve um efeito cascata na forma como os data centers da empresa se comunicam, interrompendo todos os seus serviços.

"A dependência de sistemas interconectados traz consigo um risco inerente de sistema ou mesmo falha de serviço", disse Francesco Altomare, engenheiro de vendas técnico sênior da GlobalDots, em uma entrevista por e-mail com a Lifewire,

"Para combater esse risco assustador, as empresas também utilizam o princípio da SRE (Engenharia de Confiabilidade do Sistema) como outras ferramentas, que lidam com vários níveis de redundância embutidos em cada camada de um sistema a infraestrutura."

Facebook exibido em um smartphone, sentado ao lado de um laptop em uma mesa com tampo de vidro.

Timothy Hales Bennett / Unsplash

O que pode dar errado

É importante notar que, quando um sistema como esse falha, geralmente requer uma tempestade perfeita de coisas que dão errado. É menos como um castelo de cartas esperando para cair e mais como uma porta de exaustão térmica exposta em uma estação espacial do tamanho de uma pequena lua.

A maioria das empresas toma medidas para tentar garantir que a única coisa que poderia lançar tudo no caos nunca aconteça - mas, independentemente disso, pode acontecer.

"Falhas inesperadas são uma parte do negócio e podem surgir como resultado de negligência do trabalhador, falhas na rede do provedor de serviços de Internet ou mesmo serviços de armazenamento em nuvem com problemas", disse Sally Stevens, co-fundador da FastPeopleSearch, em uma entrevista por e-mail.

"... Contanto que as etapas necessárias para proteger o sistema - como backups, roteador no local e acesso em camadas - sejam implementadas local, essas falhas são bastante improváveis. "Embora, mesmo com um exército de dispositivos de segurança, ainda seja possível que o eixo falhou.

Se o sistema que controla coisas como formas primárias de contato, eletrodomésticos, portas, etc., falhar, os resultados podem ser significativos. De uma inconveniência leve a uma catástrofe total, dependendo de quanto os indivíduos e empresas dependem de tudo isso.

Um grupo de engenheiros reunido em torno de uma mesa em um escritório.

Hinterhaus Productions / Getty Images

“Também existe o risco de hackers entrarem no sistema a partir de qualquer um dos dispositivos menos protegidos, como geladeiras e torradeiras ", acrescentou Stevens," o que pode levar ao roubo de dados e ransomware. "

Como podemos nos preparar

Não há como garantir que um sistema nunca falhará, mas existem etapas que podem ser executadas para tornar a falha menos provável ou para lidar com a falha de maneira mais suave. Uma combinação das duas abordagens que combina dispositivos de segurança e contramedidas com planos de contingência e sistemas de backup seria ideal.

"Para eliminar esses riscos criados por produtos e serviços de terceiros que são gerenciados de forma eficaz, funções e deveres em relação ao gerenciamento de risco de terceiros deve ser estritamente descrito ", disse Daniela Sawyer, fundadora e diretora de tecnologia do FindPeopleFast, em uma entrevista por e-mail, "Para florescer neste novo ambiente, os gerentes de risco devem compreender as partes essenciais de um ecossistema tão sofisticado."

O que aconteceu com o Facebook, WhatsApp e Instagram foi lamentável, mas também revelador. Pessoas que dependem de sistemas interconectados devem entender que a coisa certa que dá errado pode atrapalhar tudo. E medidas devem ser postas em prática (ou examinadas e refinadas) para tornar essas interrupções menos prováveis ​​e impactantes.

No caso do Facebook, o problema não eram os problemas do roteador, mas sim ter quase todo o seu ecossistema conectado a todo o resto. Assim, com o Facebook (o serviço) desativado, o Facebook (a empresa) teve que despender muito mais tempo e energia simplesmente organizando e resolvendo o problema. Se ele não usasse um sistema tão enraizado e interconectado ou tivesse planos de backup para lidar com uma interrupção como essa, provavelmente teria demorado muito menos para consertar.