Agencias,/Ciudad de México.- Muchos sitios web se quedaron fuera de servicio ayer tras lo que parecía una caída generalizada de la firma de computación en nube Fastly.

Docenas de webs con mucho tráfico, como las del New York Times, la CNN, Twitch, Reddit y el sitio del gobierno británico, aparecían desconectadas.

Fastly, con sede en San Francisco, reconoció que había un problema poco antes de la 1000 GMT. En sucesivas actualizaciones en su web dijo que seguía “investigando el problema”.

“El problema ha sido identificado y se ha aplicado una solución. Los clientes podrían experimentar un aumento de la carga de origen al regresar los servicios globales”, indicó la compañía una hora más tarde.

Varios sitios web que habían resultado afectados parecieron volver a funcionar.

Algunos visitantes que intentaban acceder a CNN.com encontraban un mensaje que decía “Error en Fastly: dominio desconocido: cnn.com”. Los intentos de acceder al Financial Times mostraban un mensaje similar, mientras que los sitios del New York Times y el del gobierno británico gov.uk daban un mensaje de “Error 503: Servicio no disponible”, junto a la línea “Servidor de cache Varnish”, que es la tecnología en la que se basa Fastly.

Down Detector, que monitorea caídas de servicio en internet, señaló que según sus reportes “podría haber un apagón generalizado en Fastly, lo que podría afectar a su servicio”.

Fastly se describe como una “plataforma de nube de vanguardia”. Proporciona servicios cruciales de computación en nube para muchos sitios conocidos de internet al ayudarles a almacenar su contenido en servidores de todo el mundo para que esté más cerca de los usuarios.

Fastly afirma que la acción inocente de un cliente activó un error de ‘software’

Un cliente de la compañía de servicios en la nube Fastly provocó inadvertidamente la caída de miles de páginas y servicios en internet este martes a las doce del mediodía, hora española. El fallo se produjo cuando el usuario cambió su configuración del servicio de forma totalmente correcta. Sin embargo, su acción activó un error informático que llevaba un mes oculto en el software de la compañía y que hundió el 85% de su red. El vicepresidente de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha dado los detalles de la caída en un mensaje publicado este miércoles por la compañía.

Fastly desplegó software nuevo el 12 de mayo. Allí, oculto, había un error informático que solo podía “activarse con una configuración de cliente específica y bajo determinadas circunstancias”, escribe Rockwell. Ese conjunto de casualidades se dio este 8 de junio. Es como si hubiera un imperceptible agujero en la estructura de un edificio y poco después de haberlo terminado un residente colgara un cuadro justo ahí e hiciera que todo se viniese abajo.

Fastly encontró el error a las 11.48, un minuto después del inicio del desastre, según Rockwell. Al cabo de 10 minutos habían publicado ya el primer comunicado. A las 12.27, siempre hora española, encontraron dónde estaba el problema de configuración del cliente y otros 10 minutos después sus servicios empezaron a recuperarse. Fue la media hora más larga en la historia de Fastly, el día que en su empresa, vital para muchos medios de comunicación y servicios de internet, se hizo famosa.

Fastly es una compañía llamada de red de distribución de contenidos (CDN, en sus siglas habituales en inglés). Su función es distribuir servicios en internet por miles de puntos locales en todo el mundo para acercar las páginas a los usuarios finales.

“Aunque fueron unas condiciones específicas las que provocaron la caída, deberíamos haberlo anticipado”, detalla Rockwell. “Proporcionamos servicios críticos y tratamos cualquier acción que cause problemas en los servicios con la mayor sensibilidad y prioridad”, añade. Fastly es junto a Cloudflare y Akamai una de las pocas compañías realmente globales que sostiene internet. Como se vio este martes, la estructura global de la red depende a varios niveles de pocos proveedores.

Esta descentralización ya se produce e incluso se promueve entre las empresas, como dice Andy Champagne, vicepresidente de Akamai, competidora clave de Fastly, al comentar la caída de este martes: “El uso de múltiples CDN es algo que se ha vuelto cada vez más común”, dice en un comunicado compartido por su empresa. “En teoría, las CDN múltiples proporcionan a las empresas un respaldo en caso de que una de ellas tenga un problema, pero no es una estrategia a prueba de balas. Debe aplicarse el mismo rigor a la hora de contratar proveedores incluso cuando se utilizan varias CDN, ya que la división no garantiza un tiempo de actividad del 100% para los clientes. Si una CDN sufre una interrupción, suele ser necesaria la intervención manual para dirigir el tráfico a otra CDN, no es algo automático”.

Aparte de que el servicio seguiría repartiéndose entre los dominadores del mercado, el problema al que se refiere Champagne es que levantar una estructura de software para los clientes de las CDN para redireccionar el tráfico en una caída de menos de una hora, requiere un esfuerzo considerable. Y, hasta que no haya caídas peores, sale poco a cuenta.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.