É ótimo que a AWS já tenha compartilhado um post-mortem, e podemos entender algumas coisas que correram mal, iniciando a interrupção. Um resumo dos eventos, com base no que a equipe da AWS compartilhou
The Pragmatic Engineer
The Pragmatic Engineer24/10, 22:42
O que causou a falha da AWS que pareceu derrubar metade da internet na segunda-feira? Começou com uma condição de corrida na propagação DNS do DynamoDB, que acabou definindo o dynamod.us-east-1 .amazonaws .com DNS como vazio. Uma análise detalhada e mais informações:
Para mim, existem detalhes vagos que tornam difícil (se não impossível) entender corretamente como a interrupção ocorreu, no entanto. Ainda não está claro para mim como exatamente o registro DNS foi definido como zero (a dinâmica entre os Enactores de DNS, os Planos de DNS e como os Enactores podem editar os Planos de DNS.)
99,64K