OpenAI пусна актуализирана функция за генериране на изображения в GPT‑4o. AI вече може точно да вгражда текст в изображения, да следва подробни инструкции и да взема предвид контекста на разговора, позволявайки на потребителите да персонализират изображенията, докато комуникират.
Какво се промени в генерирането на изображения на GPT‑4o?
Точно изобразяване на текст
AI вече може да вмъква думи и символи в изображение, като същевременно запазва тяхната яснота.
Редактиране в няколко стъпки
Можете да правите промени в изображението директно по време на диалога с AI. Например, ако създавате герой за видео игра, външният му вид ще остане последователен по време на редактирането.
Работа с подробни заявки
Моделът може да генерира изображения с 10-20 обекта, като запазва техните характеристики и взаимоотношения.
Интеграция с персонализирани изображения
Можете да качвате изображения и GPT‑4o ще ги анализира и използва за създаване на нови изображения.
Фотореализъм и разнообразие от стилове
Чрез обучение върху огромен брой изображения, моделът може да възпроизвежда реалистични сцени и да стилизира изображения.
Сигурност и достъп
Всички генерирани изображения вече съдържат C2PA метаданни, потвърждаващи техния произход. OpenAI също така продължава да блокира забранени заявки (като дълбоки фалшификации и съдържание с насилие).
Функцията вече е достъпна за потребители на ChatGPT Plus, Pro, Team и Free и скоро ще бъде достъпна в API за разработчици. Създаването на изображения вече е лесно като чат: просто опишете изображението, като посочите подробности като цвят, фон и формат. Въпреки това, поради подобреното качество, процесът на генериране може да отнеме до една минута.