Eli Collins, viceprezident produktového managementu ve společnosti Google DeepMind, poprvé předvedl generativní video nástroje umělé inteligence pro představenstvo společnosti v roce 2022. Navzdory pomalé rychlosti modelu, drahým provozním nákladům a někdy až nezvyklým výstupům říká, že byla pro ně okamžitá příležitost vidět čerstvé videoklipy generované z náhodné výzvy.
Nyní, jen o několik let později, Google oznámil plány na nástroj uvnitř aplikace YouTube, který umožní komukoli generovat videoklipy AI pomocí modelu Veo společnosti a přímo je zveřejňovat jako součást YouTube Shorts. „Těšíme se na rok 2025, umožníme uživatelům vytvářet samostatné videoklipy a krátké filmy,“ říká Sarah Ali, vrchní ředitelka produktového managementu na YouTube. „Budou schopni generovat šestisekundová videa z otevřené textové výzvy.“ Ali říká, že aktualizace by mohla pomoci tvůrcům, kteří hledají záběry k naplnění videa nebo se snaží představit si něco fantastického. Je pevně přesvědčena, že nástroj Veo AI nemá kreativitu nahrazovat, ale rozšiřovat.
Není to poprvé, co Google představil generativní nástroje pro YouTube, i když toto oznámení bude dosud nejrozsáhlejší integrací AI videa společnosti. Během léta Google spustil experimentální nástroj s názvem Dream Screen, který generuje pozadí AI pro videa. Před úplným zavedením generovaných klipů v příštím roce Google aktualizuje tento nástroj AI na zelené obrazovce o model Veo někdy v příštích několika měsících.
Rozlehlá technologická společnost v posledních letech předvedla několik modelů videa s umělou inteligencí, jako je Imagen a Lumiere, ale pokouší se spojit kolem jednotnější vize s modelem Veo. „Mimochodem, Veo bude naším modelem i nadále,“ říká Collins. „Neměli byste od nás čekat dalších pět modelů.“ Ano, Google pravděpodobně nakonec vydá další model videa, ale očekává, že se v blízké budoucnosti zaměří na Veo.
Google čelí konkurenci mnoha startupů vyvíjejících své vlastní generativní nástroje pro převod textu na video. Sora od OpenAI je nejznámějším konkurentem, ale model videa AI, oznámený dříve v roce 2024, zatím není veřejně dostupný a je vyhrazen pro malý počet testerů. Pokud jde o nástroje, které jsou široce dostupné, startup Runway s umělou inteligencí vydal několik verzí svého video softwaru, včetně nedávného nástroje pro adaptaci originálních videí do verzí klipu s alternativní realitou.
Oznámení YouTube přichází v době, kdy se generativní nástroje umělé inteligence staly pro tvůrce ještě spornějšími, kteří někdy považují současnou vlnu umělé inteligence za okrádání jejich práce a snahu podkopávat tvůrčí proces. Ali nevidí generativní nástroje umělé inteligence, které by se dostaly mezi tvůrce a autenticitu jejich vztahu s diváky. „Je to opravdu o publiku a o tom, co je zajímá – ne nutně o nástrojích,“ říká. „Ale pokud se vaše publikum zajímá o to, jak jste to udělali, bude to otevřené prostřednictvím popisu.“ Google plánuje vodoznak každé AI video vygenerované pro YouTube Shorts pomocí SynthID, které vloží nepostřehnutelnou značku, která pomůže identifikovat video jako syntetické, a také zahrnout do popisu prohlášení „vyrobeno pomocí AI“.
Ovlivňovači hustle-kultury se již snaží ohrozit algoritmus pomocí několika nástrojů třetích stran k automatizaci kreativního procesu a vydělávání peněz s minimálním úsilím. Povede příští rok integrace Veo k nové lavině nekvalitních, spamových krátkých videí YouTube, které dominují uživatelským kanálům? „Myslím, že naše zkušenost s doporučováním správného obsahu správnému divákovi funguje v tomto světě umělé inteligence, protože jsme to dělali v tak obrovském měřítku,“ říká Ali. Poukazuje také na to, že standardní pokyny YouTube stále platí bez ohledu na to, jaký nástroj je k vytvoření videa použit.
Umění umělé inteligence má často odlišnou estetiku, což může být znepokojivé pro tvůrce videa, kteří si cení individuality a chtějí, aby jejich obsah působil jedinečným dojmem. Collins doufá, že otisky prstů od Googlu nejsou všude na video výstupech AI. „Nechci, aby se na to lidé dívali a říkali si: ‚To je model DeepMind‘,“ říká. Získání výzvy k vytvoření výstupu umělé inteligence v souladu s tím, co si tvůrce představoval, je hlavním cílem a vyhýbat se otevřené estetice pro Veo je zásadní pro dosažení široké adaptability.
„Velkou částí cesty je ve skutečnosti budování něčeho, co je užitečné pro lidi, škálovatelné a použitelné,“ říká Collins. „Není to jen demo.“ Používá se ve skutečném produktu.“ Věří, že umístění generativních nástrojů umělé inteligence přímo do aplikace YouTube bude pro tvůrce i DeepMind transformační. „Nikdy jsme ve skutečnosti nevytvářeli produkt pro tvůrce,“ říká. „A rozhodně jsme to nikdy nedělali v takovém měřítku.“
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com