Команда разработчиков Cursor поделилась итогами эксперимента, в котором они запустили множество автономных кодинг-агентов для работы над одним проектом. На протяжении нескольких недель агенты написали свыше миллиона строк кода, ставя перед собой задачу выяснить, может ли такая техника сократить время, необходимое командам разработчиков. Основной проблемой стало отсутствие координации: когда агенты действовали на равных, лишь двадцать из них были продуктивны, остальные ждали, пока освободятся задачи. В результате была введена иерархия: планировщики исследуют код и формируют задачи, а воркеры их выполняют. В ходе эксперимента агентам на базе GPT-5.2 было дано задание создать браузер с нуля, в результате чего за неделю они сгенерировали более трех миллионов строк кода. В дополнение, GPT-5.2 показала лучшие результаты в длительных автономных задачах по сравнению с другими моделями. Главный вывод команды заключается в том, что правильные промпты важнее, чем выбор модели, и система нуждается в дальнейшей оптимизации.
Опубликовано вНовости