AWS atribuye a un error humano la caída de Amazon S3
- Cloud
Amazon Web Services ha informado de los motivos que causaron la caída de su servidor S3. La compañía ha asegurado que ésta se debió a un error humano cuando estaban realizando labores de mejora del servicio.
A principios de semana, el servidor S3 de Amazon Web Services (AWS) sufrió “altas tasas de error”, tal y como aseguró la compañía, lo que provocó que muchas páginas web, como Hootsuite, Trello, Nest, IFTTT, Trello o Alexa, no pudieran ofrecer sus servicios con normalidad.
Especial Mobile World Congress 2017 Cómo el almacenamiento flash ayuda a tu empresa |
48 horas más tarde, Amazon ha atribuido a “un error humano” la interrupción de los servicios cloud. Tal y como ha asegurado en un comunicado, “en la mañana del 28 de febrero” el equipo del S3 “estaba resolviendo un problema que hacía que el sistema de facturación fuera más lento de lo esperado”. Un miembro del equipo autorizado “ejecutó un comando” con el objetivo de eliminar “un pequeño número de servidores para los subsistemas S3” que es utilizado en el proceso de facturación del S3.
Según explica Amazon, “una de las entadas del comando se introdujo de forma errónea y se eliminó un conjunto de servidores mayor de lo previsto”.
La interrupción del servicio S3 duró tres horas y media y que durante este tiempo “tuvo un impacto en el envío y la recepción de los datos de los clientes”.
Asimismo, la compañía ha asegurado que está realizando cambios para mejorar el tiempo de recuperación de los sistemas claves de S3 y ha pedido disculpas a sus clientes por los problemas que esto haya podido originarles. “Si bien estamos orgullosos de nuestro largo historial de disponibilidad de Amazon S3, somos conscientes de lo crítico que es este servicio para nuestros clientes, sus aplicaciones y los usuarios finales. Haremos todo lo posible por aprender de esta incidencia y mejorar la disponibilidad”.
Recomendaciones que te puedan interesar…