
Pokud se všichni začneme vybírat z našich příspěvků používaných pro tréninkové modely, nesnižuje to vliv našeho jedinečného hlasu a perspektiv na tyto modely? Modely budou stále více primárním oknem všech do zbytku světa. Vypadá to, že lidé, kteří se o tyto věci starají nejméně, budou ti, kteří mají nejvíce dat, která skončí při tréninku výchozího chování modelů.
—Data vliv
Upřímně řečeno, je pro mě frustrující, že uživatelé internetu jsou nuceni odhlásit se z umělé inteligence jako výchozí. Nebylo by hezké, kdyby byl pro generativní společnosti AI normou, že se škrábají web a jakékoli další úložiště dat, která mohou najít, aby se stavěly stále větší a větší hraniční modely?
Ale bohužel tomu tak není. Společnosti jako OpenAI a Google tvrdí, že pokud byl spravedlivý přístup ke všem těmto údajům odebrán, pak by nebyla žádná z těchto technologií možná. Prozatím jsou uživatelé, kteří nechtějí přispívat k generativním modelům, přilepeni k morasování procesů odhlášení na různých webových stránkách a platformách sociálních médií.
I když současná bublina obklopující generativní AI popová, podobně jako dotcom Bubble po několika letech, modely, které napájí všechny tyto nové nástroje AI, nebudou vyhynout. V softwarových nástrojích tedy budou žít duchové vašich příspěvků na fóru ve fóru a vlákna sociálních médií a vlákna sociálních médií, která obhajují silně držené přesvědčení. Máte pravdu, že odhlášení znamená, že se aktivně pokoušíme být zahrnut do potenciálně dlouhotrvajícího kusu kultury.
Abychom vaši otázku přímo a realisticky vyřešili, jsou tyto procesy odhlášení v podstatě marné v jejich současném stavu. Ti, kteří se právě odhlásí, stále ovlivňují model. Řekněme, že vyplníte formulář pro web sociálních médií, abyste své údaje nepoužívali nebo prodávali pro školení AI. I když tato platforma respektuje, že žádá, existuje nespočet startupů v Silicon Valley s pluckými 19letými lidmi, kteří nebudou dvakrát přemýšlet o škrábání dat zveřejněných na tuto platformu, i když to není technicky. Obecně lze předpokládat, že vše, co jste kdy zveřejnili online, se z něj pravděpodobně stalo na více generativních modelů.
Dobře, ale řekněme, že byste mohli realisticky blokovat svá data z těchto systémů nebo požadovat, aby byla odstraněna poté, co by to snížilo váš hlas nebo dopad na nástroje AI? Přemýšlel jsem o této otázce několik dní a stále jsem roztrhaný.
Na jedné straně jsou vaše jedinečné informace pouze nekonečně malým příspěvkem k rozlehlosti datového souboru, takže váš hlas, jako neveřejná postava nebo autor, pravděpodobně tento model tak či onak neseká.
Z tohoto pohledu jsou vaše data jen další cihla ve zdi budovy 1 000 příběhů. A je třeba si uvědomit, že sběr dat je jen prvním krokem k vytvoření modelu AI. Vědci tráví měsíce doladění softwaru, aby dosáhli výsledků, které si přejí, a někdy se spoléhají na pracovníky s nízkými mzdami, aby označili datové sady a měřili kvalitu výstupu pro upřesnění. Tyto kroky mohou dále abstraktní údaje a snížit váš individuální dopad.
Co kdybychom to porovnali s hlasováním ve volbách? Miliony hlasů jsou odevzdány v amerických prezidentských volbách, ale většina občanů a obránců demokracie trvá na tom, že na každém hlasování záleží – s neustálým refrénem „nechte svůj hlas slyšet“. Není to dokonalá metafora, ale co kdybychom viděli naše data, která mají podobný dopad? Malý šepot mezi kakofonií hluku, ale stále ovlivňuje výstup modelu AI.
Nejsem o tomto argumentu zcela přesvědčen, ale také si nemyslím, že by tato perspektiva měla být přímo propuštěna. Zejména u odborníků na předmět jsou vaše odlišné poznatky a způsob, jak se blížit k informacím, pro vědce AI jedinečně cenné. Meta by neprošla potížemi s používáním všech těchto knih ve svém novém modelu AI, pokud by nějaká stará data udělala trik.
Při pohledu do budoucnosti bude skutečným dopadem vašich dat na tyto modely pravděpodobně inspirovat „syntetická“ data. Vzhledem k tomu, že společnosti, které vytvářejí generativní systémy AI, docházejí z kvalitních informací, aby škrábaly, vstoupí do své éry Ouroboros; Začnou používat generativní AI k replikaci lidských údajů, které se poté vrátí zpět do systému, aby trénovali další model AI, aby lépe replikovali lidské reakce. Dokud existuje generativní AI, nezapomeňte, že vy, jako člověk, budete vždy malou součástí stroje – ať už chcete být nebo ne.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com