OpenAI publicó un informe de incidente que detalla la causa de la interrupción de ChatGPT de la semana pasada y lo que están haciendo para evitar que se repita. La interrupción comenzó el 26 de diciembre de 2024 a las 10:40 a. m. y se resolvió en su mayor parte a las 3:11 p. m., excepto ChatGPT, que se recuperó al 100 % a las 6:20 p. m.
Los siguientes servicios se vieron afectados:
- ChatGPT
- Videocreación de Sora.
- API: agentes, voz en tiempo actual, lotes y DALL-E
Causa de la interrupción de OpenAI
La causa de la interrupción fue una falla en el centro de datos del proveedor de la nube que afectó las bases de datos de OpenAI. Si bien las bases de datos están reflejadas en todas las regiones, el cambio a una base de datos de respaldo requirió interacción handbook por parte del proveedor de la nube para redirigir las operaciones a un centro de datos de respaldo en otra región. Se citó la intervención handbook como forma de solucionar el corte, pero la razón dada por la que tomó tanto tiempo fue la escala del proyecto.
Una conmutación por error es un proceso automatizado para cambiar a un sistema de respaldo en caso de una falla del sistema. OpenAI anunció que están trabajando para crear cambios en la infraestructura para mejorar las respuestas a futuras fallas de las bases de datos en la nube.
OpenAI explicó:
“En las próximas semanas, nos embarcaremos en una importante iniciativa de infraestructura para garantizar que nuestros sistemas sean resistentes a una interrupción prolongada en cualquier región de cualquiera de nuestros proveedores de nube agregando una capa de indirección bajo nuestro management entre nuestras aplicaciones y nuestras bases de datos en la nube. . Esto permitirá una conmutación por error significativamente más rápida”.
Interrupción significativa de ChatGPT
OpenAI dijo que la interrupción de ChatGPT se debió a una falla en la base de datos del proveedor de nube regional, pero que el efecto fue international, como lo demuestran los informes de los usuarios en las redes sociales de toda Europa y América del Norte.
Google Tendencies, que rastrea el volumen de búsqueda, indica que este puede haber sido el evento de este tipo más grande, con más personas buscando información al respecto que en cualquier interrupción anterior.
Imagen destacada de Shutterstock/lilgrapher