OpenAI posiluje model generování obrázků ChatGPT

OpenAI spustila a nový model AI generace obrázků v úterý s názvem ChatGPT Images 2.0. Tento model může generovat více než jeden obrázek z jedné výzvy, jako je celá studijní brožura, stejně jako výstupní text, a to i v jiných než anglických jazycích, jako je čínština a hindština. Tato verze je k dispozici globálně pro uživatele ChatGPT a Codex, přičemž pro platící předplatitele je k dispozici výkonnější verze.

Když jakákoli velká společnost zabývající se umělou inteligencí uvolní nový obrazový model, může to oživit zájem a zvýšit využití, zejména pokud uživatelé sociálních sítí přijmou pozoruhodný trend, který přemění obrázky sebe sama. V loňském roce bylo uvedení modelu Nano Banana od Googlu pro společnost významným okamžikem, zvláště když uživatelé začali zveřejňovat své hyperrealistické figurky online. Začátkem tohoto roku vyvolala služba ChatGPT Images vlny na sociálních sítích, když uživatelé sdíleli karikatury vytvořené umělou inteligencí.

Obrázek může obsahovat Publikace Reklamní plakát Obličej Hlava Osoba Svatební doplňky a sluneční brýle

co je jiné?

Vzhledem k tomu, že nový model může využít „uvažování“ schopností ChatGPT, může Images 2.0 vyhledávat na internetu aktuální informace a generovat více než jeden obrázek najednou. V podstatě může bot použít další kroky k výstupu důkladnějších generací z jediné výzvy. Images 2.0 má také novější datum ukončení znalostí: prosinec 2025.

To také znamená, že výstupy z nového modelu jsou podrobnější. Vygeneroval jsem například infografiku s předpovědí počasí pro San Francisco na další den a také aktivity, které stojí za to podniknout. Obraz vytvořený ChatGPT obsahoval přesné podrobnosti o počasí pro deštivý den spolu s přesně vypadajícími kresbami budovy Ferry Building, Castro Theatre, Painted Ladies Houses a Transamerica Pyramid.

Kromě toho je Images 2.0 více přizpůsobitelný pro uživatele, kteří chtějí jedinečné poměry stran pro obrazové výstupy. Nový model dokáže generovat obrázky v rozsahu od 3:1 do šířky 1:3 a uživatelé mohou upravit velikost obrázku jako součást výzvy k nástroji AI.

První dojmy

Po několika hodinách generování obrázků s novým modelem jsem byl obecně ohromen schopnostmi vykreslování textu, alespoň v angličtině. Není to tak dávno, kdy obrazové výstupy s textem z některého z hlavních modelů často obsahovaly četné chybně tvarované znaky nebo slova s chybnými písmeny navíc. ChatGPT se dva roky předtím potýkal s přesným označováním obrázků, takže čistší a komplexnější výstupy z Images 2.0 jsou známkou neustálého zlepšování. Google se také ve svých nedávných iteracích Nano Banana zaměřil na vylepšení obrazových výstupů s textem.

Na obrázku může být Reklamní plakát Osoba Nápoj Káva Šálek kávy Oblečení Kabát a bunda

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com

Související příspěvky

5 důvodů, proč si to dvakrát rozmyslet, než použijete ChatGPT – nebo jakéhokoli Chatbota – pro finanční poradenství

Muži za vašimi oblíbenými pastmi na žízeň gayů

Příští generální ředitel společnosti Apple potřebuje uvést produkt Killer AI

Digitální dvojčata a generativní AI: neviditelná revoluce od filmu po automobilky

Internet z oběžné dráhy: jak satelity mění mobilní připojení i každodenní techniku

Autonomní stroje: jak umělá inteligence propojuje silnice, obranu i vesmír

Jak si OSVČ udrží pořádek v účetnictví a nezahltí se administrativou

Podnikání bez zmatků v dokladech: kde hledat účetní oporu a praktické informace

Diskrétní vyhledávání erotických služeb: proč rozhoduje přehlednost, lokalita a zkušenosti

Propojení dat, IT a řízení: objevte program MSc Management IT

Mohli jste zmeškat

Digitální dvojčata a generativní AI: neviditelná revoluce od filmu po automobilky

Internet z oběžné dráhy: jak satelity mění mobilní připojení i každodenní techniku

Autonomní stroje: jak umělá inteligence propojuje silnice, obranu i vesmír

Technologický podvod s AI: Evropa je nucena reagovat

NABÍZÍME VÁM UMÍSTĚNÍ SEO A PR ČLÁNKŮ

Naše projekty

Naše projekty