31 марта Google DeepMind анонсировала запуск Veo 3.1 Lite, своей самой доступной нейросети для создания видео. Модель уже доступна разработчикам через Gemini API и Google AI Studio. Теперь генерация контента стала более чем в два раза дешевле по сравнению с Veo 3.1 Fast, сохраняя при этом высокую скорость работы. Технические характеристики опубликованы в документации для разработчиков.
Анонс произошёл на фоне закрытия проекта Sora от OpenAI, оставив Google в прямой конкуренции с китайскими разработчиками, включая Seedance 2.0 от Alibaba, который демонстрирует высокое качество изображения, но сталкивается с проблемами авторских прав.
Veo 3.1 Lite позиционируется как идеальное решение для массового продакшена и прототипирования с поддержкой генерации текста и изображений в видео при разрешениях 720p и 1080p. Доступны форматы 9:16 и 16:9, а длина видео может составлять 4, 6 или 8 секунд.
Модель использует архитектуру diffusion transformer (DiT), что позволяет улучшить временную согласованность и снизить потребление вычислительных ресурсов. Google обещает обновления для разработчиков в ближайшее время, а инструменты на базе Veo уже внедряются в экосистему компании, включая YouTube Shorts и Google Photos.