Компания Anthropic выпустила обновлённую модель Claude Sonnet 4.6, которая в ряде аспектов сравнялась с флагманом Opus 4.6, а в некоторых случаях даже превзошла его. Стоимость использования осталась неизменной: $3/$15 за миллион токенов, что делает Sonnet существенно доступнее Opus. На бенчмарке SWE-bench Verified эта модель показала 79,6%, в то время как Opus набрал 80,8%. В задаче управления компьютером OSWorld Sonnet 4.6 продемонстрировал 72,5%, чуть отстав от 72,7% у Opus, а в офисных задачах обошёл его с результатом 1633 против 1606 баллов Elo. Наиболее заметный рост был замечен на ARC-AGI-2, где Sonnet 4.6 улучшил результат с 13,6% до 58,3%. Sonnet 4.6 теперь является основной моделью в claude.ai и Claude Cowork для пользователей как бесплатной, так и Pro-версий. В бета-режиме доступен контекст на 1 миллион токенов. Anthropic также отмечает, что разработчики, получившие ранний доступ, чаще выбирали именно Sonnet 4.6, отказываясь от предшествующего Opus 4.5. Новая версия значительно улучшила свои возможности работы с компьютером, а результаты в этой области повысились до уровня близкого к человеческому в задачах, таких как навигация по таблицам и заполнение веб-форм. Релиз Sonnet 4.6 подчеркивает тенденцию к укреплению позиций «средних» моделей в сравнении с флагманскими, что также заметно у конкурентов, таких как GPT-5.2 Pro и Gemini 3 Pro.
Опубликовано вНовости