Minulý rok se Stack Overflow stal jedním z prvních webů, které oznámily, že budou účtovat AI gigantům za přístup k obsahu používanému k výcviku chatbotů. Nyní populární služba Q&A pro kodéry přihlásila svého prvního zákazníka – Google – podle generálního ředitele Prashantha Chandrasekara je to začátek „smysluplného“ nového toku příjmů.
Dohoda je významná, protože zůstává nejasné, jak široce bude Google a další vývojáři AI platit za obsah potřebný pro projekty AI. Miliony knih a webových stránek podpořily vývoj systémů umělé inteligence, ale většina vydavatelů nebyla kompenzována a někteří žalují kvůli tomu, co tvrdí, že je zneužití. Mnoho vydavatelů, včetně Stack Overflow, se zdá být ohroženo ChatGPT a dalšími generativními produkty umělé inteligence, které mohou odpovídat na dotazy, které by jim dříve poslaly do cesty kodéry.
Dohoda umožní cloudové divizi společnosti Google využívat otázky a odpovědi od Stack Overflow o službách Google Cloud k poskytování pomoci s kódováním a technické podpory prostřednictvím verze chatbota Gemini od Googlu. Zákazníci cloud computingu Google budou také moci klást otázky prostřednictvím rozhraní příkazového řádku Google Cloud. „Jejich AI nemusí mít všechny odpovědi, a tak máme obrovskou schopnost pomoci dokončit tuto smyčku,“ říká Chandrasekar. „Jsme největším místem, kde se kurátorují a ověřují znalosti komunity.“
Gemini shrne odpovědi získané z Stack Overflow vlastními slovy, ale bude obsahovat logo společnosti, odkaz zpět na původní materiál a uživatelské jméno přispěvatele webu, který jej dodal. Společnosti plánují systém předvést na Google Cloud Next, výroční cloudové konferenci vyhledávací společnosti v dubnu, a spustit jej brzy poté.
Chandrasekar říká, že neexistují žádná významná omezení ohledně toho, jak může Google Cloud používat data Stack Overflow, což znamená, že je lze použít k trénování velkých jazykových modelů a dalších systémů umělé inteligence. „Na čem chceme pevně stát, jsou – pro nás nesmlouvatelné věci – důvěra, přesnost, kvalita a připisování zpět ke zdrojům těchto výstupů AI,“ říká.
Odmítl sdělit, kolik Stack Overflow platí Google za data. „Bude to pro nás smysluplná komerční nabídka v krátkodobém, střednědobém a dlouhodobém horizontu,“ říká Chandrasekar.
Skryté škrábání
Google a další vývojáři AI již dříve shromáždili data ze Stack Overflow a dalších webů bez velkého upozornění. Vzhledem k tomu, že poptávka po generativních technologiích umělé inteligence vzrostla – a ocenění společností, které je vyvíjejí, prudce vzrostlo – webové stránky dodávající základní text začaly vyžadovat to, co považují za svůj spravedlivý podíl. Naštěstí pro Stack Overflow potenciální zákazníci vzali na vědomí, říká Chandrasekar. „Nemusíme pronásledovat lidi,“ říká.
Data Stack Overflow jsou zvláště přínosná pro systémy umělé inteligence, které generují počítačový kód, které se ukázaly být oblíbené u softwarových inženýrů a jsou významným zdrojem příjmů pro Microsoft a OpenAI.
Nová dohoda Stack Overflow přichází pouhý týden poté, co Google dosáhl licenční dohody o nasávání dat z Redditu, provozovatele diskusních fór, jehož obsah pomohl chatbotům konverzovat. Reddit odhalil plány na zahájení zpoplatnění přístupu k datům těsně před Stack Overflow v loňském roce.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com