Xiaomi анонсировала запуск своей новой модели искусственного интеллекта MiMo-V2-Flash, которая доступна всем желающим. Она выделяется мощностью, скоростью и эффективностью, идеально подходя для программирования и выполнения рассуждений. MiMo-V2-Flash можно использовать на платформе Hugging Face, Google Cloud AI Studio и на специальной платформе Xiaomi для разработчиков.
Эта модель имеет архитектуру с 309 миллиардами параметров, из которых активно используются 15 миллиардов. В MiMo-V2-Flash реализованы гибридные механизмы внимания, что позволяет добиться высокой скорости ответов — до 150 токенов в секунду. Стоимость использования модели составляет $0,1 за 1 млн входных и $0,3 за 1 млн выходных токенов.
MiMo-V2-Flash показала отличные результаты в тестах, заняв первое место среди открытых моделей и близко конкурируя с закрытыми аналогами. Она поддерживает генерацию HTML-страниц и интеграцию с другими инструментами, а также предлагает пользователям возможность переключения между режимами рассуждения и быстрых ответов. На Hugging Face доступны веса модели, а код для вывода направлен разработчикам SGLang.