To świetnie, że AWS już podzielił się raportem po incydencie, i możemy zrozumieć niektóre rzeczy, które poszły źle, rozpoczynając awarię. Podsumowanie wydarzeń, na podstawie tego, co zespół AWS udostępnił.
The Pragmatic Engineer
The Pragmatic Engineer24 paź, 22:42
Co spowodowało awarię AWS, która wydawała się zablokować połowę internetu w poniedziałek? Zaczęło się od warunku wyścigu w propagacji DNS DynamoDB, co ostatecznie spowodowało ustawienie DNS dynamod.us-east-1.amazonaws.com na pusty. Szczegółowa analiza i więcej informacji:
Dla mnie istnieją niejasne szczegóły, które utrudniają (jeśli nie uniemożliwiają) właściwe zrozumienie, jak doszło do awarii. Wciąż nie jest dla mnie jasne, jak dokładnie rekord DNS został ustawiony na zero (dynamika między DNS Enactors, DNS Plans i tym, jak Enactors mogą edytować DNS Plans).
99,45K