Качество созданных картинок значительно выросло по сравнению с прошлой моделью —  пишет « Hi-Tech_Mail.ru ».  

Андрей Бритенков

Редактор Hi-Tech Mail

инопланетяне в кафе
Пример сгенерированного в ChatGPT Images 2.0 изображения
Источник: OpenAI

OpenAI представила новую ИИ-модель ChatGPT Images 2. Это самый продвинутый генератор изображений, созданный компанией.

Разработчики отмечают, что новый алгоритм стал заметно точнее следовать сложным и детализированным инструкциям. Он корректно размещает объекты, выстраивает связи между ними и качественно прорабатывает мелкие элементы — текст, иконки, интерфейс и сложные визуальные сцены.

девушка на берегу
Пример сгенерированного в ChatGPT Images 2.0 изображенияИсточник: OpenAI

Модель лучше понимает композицию и демонстрирует так называемый визуальный вкус. За счет этого изображения выглядят менее «синтетическими» и больше напоминают продуманный дизайн. Система корректно работает с разными языками и использует расширенные визуальные знания, чтобы достраивать недостающие детали.

горка риса
Пример сгенерированного в ChatGPT Images 2.0 изображенияИсточник: OpenAI

ChatGPT Images 2.0 ориентирована на сложные визуальные задачи, где важны точность, актуальность и согласованность элементов. Она может наглядно объяснять процессы, передавать атмосферу, визуализировать идеи и выстраивать аргументацию через изображения. Кроме того, теперь генератор лучше работает с иностранными языками, которые не используют латиницу. В частности, в компании отметили улучшенную работу с японским, корейским и китайским языком.

сгенерировано в ChatGPT Images 2.0
Пример сгенерированных в ChatGPT Images 2.0 изображений

«Images 2.0 также демонстрирует существенно более высокую точность при работе с широким спектром визуальных стилей. Модель лучше передает ключевые особенности фотографий — включая мелкие несовершенства, добавляющие реализм, — а также кинематографические кадры, пиксель-арт, мангу и другие выразительные визуальные направления, обеспечивая более стабильную передачу текстур, освещения, композиции и деталей. В результате модель способна создавать изображения, которые точнее соответствуют заданному стилю, а не просто его имитируют. Это особенно полезно для прототипирования игр, создания раскадровок, маркетинговых материалов и разработки визуальных ассетов в конкретной стилистике или жанре», — подчеркнули в OpenAI.

график цвета
Пример сгенерированного в ChatGPT Images 2.0 изображенияИсточник: OpenAI

Однако у модели сохраняются некоторые ограничения. Например, пользователи могут столкнуться со сложностями при генерации изображений, которые требуют «полной и целостной модели физического мира». Например, речь идет об инструкциях по сборке оригами. Также проблемы могут возникнуть при создании подписей и различных графиков — в компании просят их перепроверять.

ChatGPT Images 2.0 уже доступен всем пользователям ChatGPT. При этом у владельцев подписки Plus, Pro или Business есть расширенные возможности с функцией Thinking.

Ранее стало известно, что популярность ChatGPT продолжает падать.

Нейросети

chatgpt

Искусственный интеллект

OpenAI

От qwert.uz