Millones de usuarios de todo el mundo se desesperaron cuando Facebook, Instagram y WhatsApp estuvieron inactivos durante más de seis horas el lunes por la noche.
En retrospectiva, la especulación sobre lo que realmente sucedió ha florecido, a pesar de que la compañía se explicó poco después de haber recuperado las tres plataformas.
Luego, Facebook explicó que el tiempo de inactividad se debió a cambios en la configuración de los enrutadores de la red troncal que coordinan el tráfico de la red entre los centros de datos.
– El error tuvo consecuencias importantes en la forma en que se comunican nuestros centros de datos, lo que provocó una interrupción total, escribió la compañía.
Pero, ¿qué significa esto realmente?
El martes por la noche, más de un día después de ocurrido el error, Facebook revela más detalles sobre lo sucedido. Lo hacen en una publicación de blog sobre la llamada ingeniería de Facebook.
– Ahora que nuestra plataforma está funcionando como de costumbre, pensé que valía la pena compartir un poco más de detalles sobre lo que sucedió y por qué, y lo que podemos aprender de ella, escribe Santosh Janardhan.
Perdió el acceso a sus “centros de datos”
En la publicación, Facebook escribe que los enrutadores de la red troncal fueron eliminados por una falla en el sistema en el que los enrutadores almacenan datos.
La red troncal coordina todas las instalaciones de datos de Facebook, que están conectadas a través de cables de fibra óptica de una milla de largo y se almacenan en los llamados “centros de datos”.
Cuando se abre una de las aplicaciones de la empresa y se van a cargar datos, por ejemplo, sus mensajes en la bandeja de entrada, los datos viajan al teléfono móvil desde el centro de datos más cercano.
En el centro de datos, los datos se procesan y se envían a su teléfono.
Los datos entre estas instalaciones se procesan en enrutadores, que leen datos entrantes y salientes.
Los enrutadores deben actualizarse y mantenerse regularmente, por ejemplo, cuando se va a reparar un cable de fibra, se debe aumentar la capacidad o se debe actualizar el software. Luego, Facebook elimina partes de la red troncal para hacer “mantenimiento fuera de línea”.
Esto fue lo que sucedió ayer y lo que hizo que las cosas salieran mal. Durante un trabajo de mantenimiento de rutina, toda la red troncal se desconectó accidentalmente.
– Ocurrió muy rápido
El incidente llevó a que todo Facebook se desconectara por completo de todos sus centros de datos e Internet.
– Todo esto pasó muy rápido. Cuando nuestros ingenieros informáticos intentaron averiguar qué había sucedido y cómo, se enfrentaron a grandes desafíos, escribe Janardhan en la publicación.
Facebook también escribe que todavía no hay indicios de que se hayan filtrado datos del usuario como resultado del tiempo de inactividad.
Lo especial del largo tiempo de inactividad de Facebook esta vez fue que los problemas no solo afectaron a los usuarios de las aplicaciones, sino también a los propios empleados de la empresa, escribe TechCrunch.
No ingresaron a las oficinas y no se les permitió realizar ningún trabajo porque el tiempo de inactividad también afectó los sistemas internos. Esto también fue confirmado por Facebook en otro mensaje.