Es genial que AWS ya haya compartido un informe postmortem, y podemos entender algunas cosas que salieron mal, comenzando con la interrupción. Un resumen de los eventos, basado en lo que compartió el equipo de AWS
The Pragmatic Engineer
The Pragmatic Engineer24 oct, 22:42
¿Qué causó la caída de AWS que pareció derribar la mitad de internet el lunes? Todo comenzó con una condición de carrera en la propagación DNS de DynamoDB, que terminó configurando el DNS dynamod.us-east-1.amazonaws.com como vacío. Un análisis profundo y más detalles:
Para mí, hay detalles vagos que hacen difícil (si no imposible) entender correctamente cómo ocurrió la interrupción. Todavía no me queda claro cómo se estableció exactamente el registro DNS en cero (la dinámica entre los Ejecutores de DNS, los Planes de DNS y cómo los Ejecutores pueden editar los Planes de DNS).
99,63K