OpenAI опубликовала технический блог, в котором рассказала о том, как PostgreSQL поддерживает работу ChatGPT, имеющего 800-900 миллионов активных пользователей каждую неделю. Интересный факт: для своей архитектуры компания не использует шардирование, полагаясь на единственный основной сервер и около 50 реплик для чтения.
Инженер OpenAI Бохан Чжан поделился подробностями на конференции PGConf.Dev 2025. Он сообщил, что кластер справляется с более чем миллионом запросов в секунду, демонстрируя время ответа в низкие двузначные миллисекунды на 99-м перцентиле. При этом используется стандартный PostgreSQL без кастомных модификаций, только с оптимизированными настройками пулинга соединений и индексации.
Однако, запись остается узким местом: все операции записи направляются на один основной сервер. Команда оптимизирует этот процесс, используя отложенные записи и контролируя скорость загрузки данных. Для чтения же реплики распределены по регионам, и трафик делится по приоритетам, что позволяет избежать задержек от тяжелых аналитических запросов. За последние девять месяцев был зарегистрирован только один серьезный инцидент, связанный с PostgreSQL.
Такой подход OpenAI противоречит современным тенденциям использования распределенных баз данных. Шардирование упрощает масштабирование записи, но усложняет другие процессы, такие как миграция и бэкапы. В OpenAI пришли к выводу, что для нагрузки ChatGPT, где преобладает чтение, более целесообразно максимально эффективно использовать один кластер, чем создавать распределенную архитектуру.