AWS已经分享了事后分析,这真是太好了,我们可以了解一些导致停机的错误。 根据AWS团队分享的内容,事件的总结
The Pragmatic Engineer
The Pragmatic Engineer10月24日 22:42
导致周一 AWS 故障的原因是什么,这次故障让人感觉像是瘫痪了半个互联网? 这始于 DynamoDB 的 DNS 传播中的竞争条件,最终将 dynamod.us-east-1 .amazonaws .com 的 DNS 设置为空。 深入分析和更多细节:
对我来说,有一些模糊的细节使得很难(如果不是不可能的话)正确理解停机是如何发生的。 我仍然不清楚,DNS 记录是如何被设置为零的(DNS 执行者、DNS 计划之间的动态,以及执行者如何编辑 DNS 计划)。
93.05K