Quincy Surasmith je rozhlasový novinář a herec, ale můžete také slyšet jeho hlas a nikdy si to neuvědomíte. To proto, že byl hlasem thajsky mluvících kreslených filmů, klábosícího davu v pozadí a postav bez větších řečnických rolí. Není to všechno okouzlující. „Vydávám vrčící zvuky, bije mě nějaký chlap,“ říká Suarasmith. „Chce to specifické improvizační a herecké schopnosti.“
Brzy by mohlo hrozit, že budou tyto chrochtání a klábosení na pozadí nahrazeny umělou inteligencí. Hlasové hraní je vysoce specializovaná dovednost, ale generativní umělá inteligence je stále zběhlejší v mluvení, od klonování hlasů celebrit po vyprávění audioknih. Technologie nejenže vytváří větší konkurenci o pracovní místa; hlasoví herci se také obávají, že jejich vokály budou odcizeny a zkopírovány, aby propagovaly dezinformace a dezinformace, stanou se oběťmi hluboce falšovaných informací nebo se bez jejich souhlasu zaslechnou, jak se objevují v pornografickém obsahu – všechny situace, které by poškodily jejich profesionální reputaci a ukradly jejich největší a nejznámější aktivum. : jejich hlasy.
Experti z oboru se shodují, že během boomu gen-AI dojde ke ztrátě některých pracovních míst. Levná hlasová práce na základní úrovni může být pravděpodobně nahrazena strojově generovanými vokály. Ale jsou také optimisté, že umělá inteligence nedokáže plně automatizovat to, co hlasoví herci dělají. Aby producenti získali za řemeslem ty správné emoce, dialekty a umění, budou muset najmout lidi. Pro animované postavy v představeních s vysokou produkční hodnotou je životně důležité mít lidské herce, kteří budou předávat kulturní nuance. Surasmith se ale obává, že AI může být levnější najmout na některé z menších koncertů: „Je to něco, co si produkční společnosti budou myslet: ‚Hele, to je vyměnitelná část?’“
AI má tendenci aby byly hlasy „co nejnudnější,“ říká Dan Lenard, prezident Word-Voices Organization, neziskové asociace pro hlasovou práci. Tato technologie by mohla být levným řešením pro společnosti, které točí například informační HR videa, ale syntetické hlasy nezapojují lidi stejným způsobem jako lidé. „Každý hlas je jiný, každý přízvuk je jiný, a myslím, že to je jedna z věcí, které umělá inteligence nemůže napodobit,“ říká Lenard.
Firmy však stále hledají příležitosti. Minulý týden společnost Spotify oznámila pilotní verzi funkce překladu podcastů. Je částečně poháněn generativní hlasovou technologií OpenAI a překládá hlasy podcasterů do jiných jazyků. První várka obsahuje populární postavy, jako jsou herci Dax Shepard a Monica Padman, sportovní hlasatel Bill Simmons a bývalý Denní show moderátor Trevor Noah. Poté OpenAI také oznámila, že do svého chatbota ChatGPT integrovala hlasovou technologii, takže s ním lidé mohou mluvit tam a zpět.
Rychlý pokrok v technologii ohrožuje více než jen práci hlasových umělců; herci se také obávají, že jejich hlasy by mohly být použity k vytvoření nového obsahu, který nepodepsali. Před dvěma lety tým pozadu Roadrunner, dokument o zesnulém Anthony Bourdainovi, použil AI ke klonování jeho hlasu a nechal jej přečíst e-mail, který napsal. Tento krok spustil v Hollywoodu poplašné zvony a vyvolal etické otázky o tom, jak by umělá inteligence mohla přivést zpět k životu hlasy, gesta a slova lidí poté, co zemřeli.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com