Es ist großartig, dass AWS bereits einen Nachbericht geteilt hat, und wir können einige Dinge verstehen, die schiefgelaufen sind, die den Ausfall ausgelöst haben. Eine Zusammenfassung der Ereignisse, basierend auf dem, was das AWS-Team geteilt hat.
The Pragmatic Engineer
The Pragmatic Engineer24. Okt., 22:42
Was hat den AWS-Ausfall verursacht, der sich anfühlte, als würde er die Hälfte des Internets am Montag lahmlegen? Es begann mit einem Race Condition in der DNS-Propagation von DynamoDB, die schließlich die dynamod.us-east-1.amazonaws.com-DNS auf leer setzte. Eine tiefgehende Analyse und weitere Details:
Für mich gibt es vage Details, die es schwer (wenn nicht unmöglich) machen, richtig zu verstehen, wie es zu dem Ausfall kam. Es ist mir immer noch unklar, wie genau der DNS-Eintrag auf null gesetzt wurde (die Dynamik zwischen DNS-Akteuren, DNS-Plänen und wie Akteure DNS-Pläne bearbeiten können).
99,45K