Новые модели машинного перевода от Tencent

Компания Tencent анонсировала две новые модели для машинного перевода: HY‑MT1.5-1.8B и HY‑MT1.5-7B. Младшая модель быстро завоевала популярность, заняв первое место на платформе Hugging Face, в то время как старшая модель претендует на звание новой опенсорсной SOTA в этой области.

HY‑MT1.5-1.8B оптимизирована для работы на потребительском оборудовании, занимает всего около 1 ГБ памяти и обеспечивает быструю генерацию — 50 токенов с задержкой 0,18 секунды. Разработчики утверждают, что её качество перевода превосходит многие коммерческие API благодаря применению продвинутой дистилляции, где компактная модель учится у более крупных аналогов.

HY‑MT1.5-7B предназначена для облачных решений и демонстрирует производительность на уровне 90% лучших закрытых моделей, таких как Gemini 3.0 Pro, что открывает новые горизонты для сервисов на открытом коде. Обе модели поддерживают 33 языка и 5 диалектов, включая кантонский и тамильский, а также предлагают функционал для терминологии, контекстного перевода и сохранения форматирования. Tencent также выпустила квантизированные версии для улучшения производительности и доступности. Для удобства облачного развёртывания уже доступен Docker-образ 7B-версии.