Китайский техногигант научил искусственный интеллект создавать презентации и плакаты с идеальной версткой — пишет « Hi-Tech_Mail.ru ».

Автор новостей

Компания Alibaba обновила свой генератор изображений, и теперь он умеет работать как профессиональный дизайнер. Новая версия получила сразу несколько прорывных улучшений, которые выводят ее за рамки обычных ИИ-рисовалок.
Главное нововведение — модель понимает промпты длиной до тысячи токенов. Это значит, что можно описать сложную композицию в мельчайших деталях: расположение элементов, цветовую гамму, типографику, даже содержание текстовых блоков. Раньше приходилось дробить задачу на несколько запросов или мучиться с редактированием результата. Теперь ИИ генерирует готовые презентации, инфографику или комиксы за один раз.

Типографика стала профессиональной, и если прежние версии часто «ломали» текст, делали его нечитаемым или искажали иероглифы, то обновленная система точно воспроизводит надписи — от заголовков до мелкого шрифта в таблицах. Модель корректно работает с китайскими, английскими и другими языками, соблюдает выравнивание и даже имитирует разные каллиграфические стили. В примерах от разработчиков ИИ написал классическое китайское стихотворение в стиле императорской каллиграфии и создал календарь с точной раскладкой дат.
Разрешение выросло до 2K (2048×2048 пикселей) без потери детализации. Раньше для получения четкой картинки приходилось использовать апскейлеры. Теперь нейросеть сразу выдает изображения с проработанными текстурами: видны поры кожи, переплетение нитей ткани, рельеф архитектурных элементов. Это особенно заметно в фотореалистичных сценах — портретах, пейзажах, предметной съемке.

Пока западные сервисы вроде Midjourney требуют подписку, Qwen-Image-2.0 доступна без ограничений на официальном сайте. Разработчики объединили две ветки развития в одну модель. Раньше Alibaba развивала отдельно генератор (для создания с нуля) и редактор (для изменения готовых картинок). Теперь обе функции работают в едином интерфейсе. Можно загрузить фотографию и попросить ИИ вписать в нее текст, добавить объекты или изменить композицию — система сохранит стилистическое единство. Несмотря на расширенные возможности, модель стала компактнее и весит всего 7 миллиардов параметров против десятков миллиардов у конкурентов. Это ускорило обработку запросов и снизило требования к железу. Пользователи отмечают, что генерация занимает считаные секунды даже на сложных промптах.
Также недавно рассказывали о Seedance 2.0: ИИ, который создает и монтирует видео сам. Подробности в статье.
