È fantastico che AWS abbia già condiviso un post-mortem, e possiamo capire alcune cose che sono andate male, iniziando dall'interruzione. Un riepilogo degli eventi, basato su quanto condiviso dal team di AWS
The Pragmatic Engineer
The Pragmatic Engineer24 ott, 22:42
Cosa ha causato l'interruzione di AWS che sembrava aver messo giù metà di internet lunedì? È iniziato con una condizione di gara nella propagazione DNS di DynamoDB, che ha finito per impostare il DNS dynamod.us-east-1 .amazonaws .com su vuoto. Un approfondimento e ulteriori dettagli:
Per me, ci sono dettagli vaghi che rendono difficile (se non impossibile) comprendere correttamente come si sia verificato l'interruzione, però. Non è ancora chiaro per me come esattamente il record DNS sia stato impostato a zero (le dinamiche tra gli Attuatori DNS, i Piani DNS e come gli Attuatori possano modificare i Piani DNS).
93,05K