
Co je to Budoucnost podobného tlačítka ve věku umělé inteligence? Max Levchin – spoluzakladatel PayPal a generální ředitel a potvrzuje, že se ozývá novou a nesmírně cennou roli pro to, aby se údaje vycvičily AI, aby dospěly k závěrům více v souladu s těmi, které by lidský rozhodovač učinil.
Je to známá quandary ve strojovém učení, že počítač představený s funkcí jasné odměny se zapojí do neúnavného učení posílení, aby se zlepšil jeho výkon a maximalizoval tuto odměnu-ale tato optimalizační cesta často vede systémy AI k velmi odlišným výsledkům, než by vyplynulo z lidí, kteří vykonávají lidský úsudek.
Pro zavedení nápravné síly vývojáři AI často používají to, co se nazývá učení posílení z lidské zpětné vazby (RLHF). V podstatě uvádějí lidský palec na stupnici, když počítač dorazí ke svému modelu tím, že trénuje na data odrážející skutečné preference skutečných lidí. Odkud však pocházejí tato data preference lidských preferencí a kolik z nich je potřeba, aby vstup byl platný? Doposud to byl problém s RLHF: Je to nákladná metoda, pokud vyžaduje najímání lidských supervizorů a anotátorů, aby vstoupili do zpětné vazby.
A to je problém, o kterém si Levchin myslí, že by mohl být vyřešen podobným tlačítkem. Všimne si nashromážděného zdroje, který dnes sedí v rukou Facebooku jako darsend každému vývojáři, který chce vyškolit inteligentního agenta na údaje o lidských preferencích. A jak velký je to dohodu? „Tvrdil bych, že jednou z nejcennějších věcí Facebooku je, že hora, která se líbí dat,“ řekl nám Levchin. Ve skutečnosti v tomto inflexním bodě ve vývoji umělé inteligence, který má přístup k „jakému obsahu mají lidé, které lidé používají pro školení modelů AI, je pravděpodobně jednou z nejcennějších věcí na internetu.“
Zatímco Levchin si představuje AI učení z lidských preferencí prostřednictvím tlačítka podobného, AI již mění způsob, jakým jsou tyto preference tvarovány na prvním místě. Platformy sociálních médií ve skutečnosti aktivně využívají AI nejen k analýze lajků, ale také k jejich předpovědi – potenciálně vykreslují samotné tlačítko zastaralé.
Bylo to pro nás výrazné pozorování, protože, jak jsme hovořili s většinou lidí, předpovědi většinou přicházely z jiného úhlu a popisovaly, jak by tlačítko podobné ovlivnilo výkon AI, ale jak by AI změnila svět podobného tlačítka. Již jsme slyšeli, AI se používá ke zlepšení algoritmů sociálních médií. Začátkem roku 2024 například Facebook experimentoval s použitím AI k přepracování algoritmu, který uživatelům doporučuje videa navizení. Mohlo by to přijít s lepším vážením proměnných, aby se předpovídalo, které video by uživatel nejvíce rád sledoval? Výsledek tohoto raného testu ukázal, že by mohl: aplikovat AI na úkol splacené v delších dobách sledování – metrika výkonu Facebook doufal, že zvýší.
Když jsme se zeptali spoluzakladatele YouTube Steve Chen, co budoucnost platí pro tlačítko podobně, řekl: „Někdy se ptám, zda bude podobné tlačítko potřeba, když je AI dostatečně sofistikovaný, aby řekl algoritmus se 100 % přesností, které chcete sledovat, na základě samotného hlediska, jak je to, co je možné, aby to bylo možné, aby to bylo možné, aby to bylo možné, aby to bylo možné, a to je, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to tak, že je to k dispozici. “
Pokračoval však zdůraznit, že jedním z důvodů, proč může být tlačítko podobné potřebné, je zvládnout ostré nebo dočasné změny v potřebách pozorování kvůli životním událostem nebo situacím. „Jsou dny, kdy chci sledovat obsah, který je o něco důležitější, řekněme, moje děti,“ řekl. Chen také vysvětlil, že tlačítko podobně může mít dlouhověkost kvůli své roli při přilákání inzerentů – další klíčové skupiny vedle diváků a tvůrců – protože podobné působí jako nejjednodušší možný závěs pro spojování těchto tří skupin. S jedním klepnutím divák současně přináší zhodnocení a zpětnou vazbu přímo poskytovateli obsahu a důkaz o zapojení a preferenci s inzerentem.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com