OpenAI spustila a nový model AI generace obrázků v úterý s názvem ChatGPT Images 2.0. Tento model může generovat více než jeden obrázek z jedné výzvy, jako je celá studijní brožura, stejně jako výstupní text, a to i v jiných než anglických jazycích, jako je čínština a hindština. Tato verze je k dispozici globálně pro uživatele ChatGPT a Codex, přičemž pro platící předplatitele je k dispozici výkonnější verze.
Když jakákoli velká společnost zabývající se umělou inteligencí uvolní nový obrazový model, může to oživit zájem a zvýšit využití, zejména pokud uživatelé sociálních sítí přijmou pozoruhodný trend, který přemění obrázky sebe sama. V loňském roce bylo uvedení modelu Nano Banana od Googlu pro společnost významným okamžikem, zvláště když uživatelé začali zveřejňovat své hyperrealistické figurky online. Začátkem tohoto roku vyvolala služba ChatGPT Images vlny na sociálních sítích, když uživatelé sdíleli karikatury vytvořené umělou inteligencí.
co je jiné?
Vzhledem k tomu, že nový model může využít „uvažování“ schopností ChatGPT, může Images 2.0 vyhledávat na internetu aktuální informace a generovat více než jeden obrázek najednou. V podstatě může bot použít další kroky k výstupu důkladnějších generací z jediné výzvy. Images 2.0 má také novější datum ukončení znalostí: prosinec 2025.
To také znamená, že výstupy z nového modelu jsou podrobnější. Vygeneroval jsem například infografiku s předpovědí počasí pro San Francisco na další den a také aktivity, které stojí za to podniknout. Obraz vytvořený ChatGPT obsahoval přesné podrobnosti o počasí pro deštivý den spolu s přesně vypadajícími kresbami budovy Ferry Building, Castro Theatre, Painted Ladies Houses a Transamerica Pyramid.
Kromě toho je Images 2.0 více přizpůsobitelný pro uživatele, kteří chtějí jedinečné poměry stran pro obrazové výstupy. Nový model dokáže generovat obrázky v rozsahu od 3:1 do šířky 1:3 a uživatelé mohou upravit velikost obrázku jako součást výzvy k nástroji AI.
První dojmy
Po několika hodinách generování obrázků s novým modelem jsem byl obecně ohromen schopnostmi vykreslování textu, alespoň v angličtině. Není to tak dávno, kdy obrazové výstupy s textem z některého z hlavních modelů často obsahovaly četné chybně tvarované znaky nebo slova s chybnými písmeny navíc. ChatGPT se dva roky předtím potýkal s přesným označováním obrázků, takže čistší a komplexnější výstupy z Images 2.0 jsou známkou neustálého zlepšování. Google se také ve svých nedávných iteracích Nano Banana zaměřil na vylepšení obrazových výstupů s textem.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com


