Сбой в Amazon Web Services: парализованы популярные сервисы

20 октября 2025 года Amazon Web Services (AWS), ведущий облачный провайдер в мире, столкнулся с масштабным сбоем, который нарушил работу многочисленных известных сайтов и приложений на планете. Среди пострадавших оказались такие платформы, как Zoom, Signal, Snapchat, WhatsApp, а также игровые сервисы, включая Roblox и Fortnite, и финансовые учреждения, такие как Lloyds и Bank of Scotland. Основной причиной сбоя стала ошибка в системе управления DNS для базы данных DynamoDB в регионе US-EAST-1 (Северная Вирджиния). Две автоматизированные программы, ответственные за обновление DNS-записей, одновременно изменили адреса серверов, не синхронизировав свои действия. Это привело к перезаписи уже обновленных записей старыми данными и удалению этих «старых» записей, что в итоге обнулило адреса серверов. Восстановление системы заняло инженерам AWS около 15 часов. К 21 октября основные сервисы были восстановлены, хотя некоторые процессы все еще испытывали нагрузку от отложенных запросов. Инцидент еще раз подчеркнул важность распределения нагрузки и децентрализации для повышения устойчивости облачных сервисов.