Google DeepMind запускает доступную нейросеть Veo 3.1 Lite

31 марта Google DeepMind анонсировала запуск Veo 3.1 Lite, своей самой доступной нейросети для создания видео. Модель уже доступна разработчикам через Gemini API и Google AI Studio. Теперь генерация контента стала более чем в два раза дешевле по сравнению с Veo 3.1 Fast, сохраняя при этом высокую скорость работы. Технические характеристики опубликованы в документации для разработчиков.

Анонс произошёл на фоне закрытия проекта Sora от OpenAI, оставив Google в прямой конкуренции с китайскими разработчиками, включая Seedance 2.0 от Alibaba, который демонстрирует высокое качество изображения, но сталкивается с проблемами авторских прав.

Veo 3.1 Lite позиционируется как идеальное решение для массового продакшена и прототипирования с поддержкой генерации текста и изображений в видео при разрешениях 720p и 1080p. Доступны форматы 9:16 и 16:9, а длина видео может составлять 4, 6 или 8 секунд.

Модель использует архитектуру diffusion transformer (DiT), что позволяет улучшить временную согласованность и снизить потребление вычислительных ресурсов. Google обещает обновления для разработчиков в ближайшее время, а инструменты на базе Veo уже внедряются в экосистему компании, включая YouTube Shorts и Google Photos.