Качество созданных картинок значительно выросло по сравнению с прошлой моделью — пишет « Hi-Tech_Mail.ru ».

Редактор Hi-Tech Mail

Источник: OpenAI
OpenAI представила новую ИИ-модель ChatGPT Images 2. Это самый продвинутый генератор изображений, созданный компанией.
Разработчики отмечают, что новый алгоритм стал заметно точнее следовать сложным и детализированным инструкциям. Он корректно размещает объекты, выстраивает связи между ними и качественно прорабатывает мелкие элементы — текст, иконки, интерфейс и сложные визуальные сцены.

Модель лучше понимает композицию и демонстрирует так называемый визуальный вкус. За счет этого изображения выглядят менее «синтетическими» и больше напоминают продуманный дизайн. Система корректно работает с разными языками и использует расширенные визуальные знания, чтобы достраивать недостающие детали.

ChatGPT Images 2.0 ориентирована на сложные визуальные задачи, где важны точность, актуальность и согласованность элементов. Она может наглядно объяснять процессы, передавать атмосферу, визуализировать идеи и выстраивать аргументацию через изображения. Кроме того, теперь генератор лучше работает с иностранными языками, которые не используют латиницу. В частности, в компании отметили улучшенную работу с японским, корейским и китайским языком.

«Images 2.0 также демонстрирует существенно более высокую точность при работе с широким спектром визуальных стилей. Модель лучше передает ключевые особенности фотографий — включая мелкие несовершенства, добавляющие реализм, — а также кинематографические кадры, пиксель-арт, мангу и другие выразительные визуальные направления, обеспечивая более стабильную передачу текстур, освещения, композиции и деталей. В результате модель способна создавать изображения, которые точнее соответствуют заданному стилю, а не просто его имитируют. Это особенно полезно для прототипирования игр, создания раскадровок, маркетинговых материалов и разработки визуальных ассетов в конкретной стилистике или жанре», — подчеркнули в OpenAI.

Однако у модели сохраняются некоторые ограничения. Например, пользователи могут столкнуться со сложностями при генерации изображений, которые требуют «полной и целостной модели физического мира». Например, речь идет об инструкциях по сборке оригами. Также проблемы могут возникнуть при создании подписей и различных графиков — в компании просят их перепроверять.
ChatGPT Images 2.0 уже доступен всем пользователям ChatGPT. При этом у владельцев подписки Plus, Pro или Business есть расширенные возможности с функцией Thinking.
Ранее стало известно, что популярность ChatGPT продолжает падать.
