К концу 2025 года мир генерации изображений по текстовым подсказкам значительно расширился. Среди известных моделей, таких как DALL·E 3 и Midjourney v7, появились новинки: Google Imagen 4 и Seedream 4.0. Однако, несмотря на высокие требования новых моделей, локальные решения также не отстают. В частности, Z-Image Turbo (ZIT) от Tongyi Lab, имеющая всего 6 миллиардов параметров, привлекла внимание благодаря своей эффективности и скорости. Эта модель демонстрирует отличные результаты при генерации фотореалистичных изображений, используя всего 9 шагов. В отличие от более тяжелых аналогов, ZIT предлагает легкость в обучении и высокое качество итоговых картинок. Пользователи отмечают ее способность адекватно интерпретировать текстовые подсказки и выдавать качественные изображения, что делает ее желанным инструментом для энтузиастов. Важным моментом является возможность локальной работы, что делает ZIT доступной для широкой аудитории.
Опубликовано вНовости