Здорово, что AWS уже поделился посмертным отчетом, и мы можем понять некоторые вещи, которые пошли не так, начиная с отключения. Сводка событий, основанная на том, что поделилась команда AWS
The Pragmatic Engineer
The Pragmatic Engineer24 окт., 22:42
Что стало причиной сбоя AWS, который, казалось, отключил половину интернета в понедельник? Все началось с состояния гонки в распространении DNS DynamoDB, что в итоге привело к тому, что DNS dynamod.us-east-1.amazonaws.com оказался пустым. Глубокий анализ и больше деталей:
Для меня есть неясные детали, которые делают трудным (если не невозможным) правильное понимание того, как произошел сбой. Мне все еще неясно, как именно запись DNS была установлена в ноль (динамика между DNS-исполнителями, DNS-планами и тем, как исполнители могут редактировать DNS-планы).
99,63K