Alibaba представляет новую модель Qwen3-Next-80B-A3B в сфере ИИ

Компания Alibaba сделала заметный шаг в развитии искусственного интеллекта, выпустив модель Qwen3-Next-80B-A3B. Эта модель с 80 миллиардами параметров отличается высокой эффективностью: для каждого токена активируется всего 3 миллиарда параметров, что делает процесс обучения и инференса в десять раз дешевле и быстрее по сравнению с Qwen3-32B. Особенно хорошо модель справляется с текстами длиной более 32 тысяч токенов.

Основой Qwen3-Next-80B-A3B является гибридная архитектура Gated DeltaNet + Gated Attention, которая сочетает скорость и точность. Уникальная схема Mixture-of-Experts включает 512 экспертов, из которых одновременно работают лишь 10, что позволяет эффективно распределять ресурсы.

Модель поддерживает Multi-Token Prediction, предсказывая сразу несколько слов, что ускоряет генерацию текста без потери качества. В тестах Qwen3-Next-80B-A3B значительно опережает Qwen3-32B и приближается к результатам более дорогой модели Qwen3-235B в задачах анализа контекста.

Специальные версии модели, такие как Qwen3-Next-80B-A3B-Instruct, почти достигли уровня качества флагманской 235B-модели, а Qwen3-Next-80B-A3B-Thinking превзошла Google Gemini-2.5-Flash-Thinking в задачах рассуждений. Модель доступна на платформах Qwen Chat, HuggingFace, ModelScope, Kaggle а также в облаке Alibaba Cloud.

Начните работу с BotHub и получите 100 000 бесплатных токенов для первых задач без необходимости использовать VPN!