Demis Hassabis z Google DeepMind říká, že Gemini je nové plemeno umělé inteligence

Demis Hassabis se nikdy neostýchal hlásat velké skoky v umělé inteligenci. Nejpozoruhodnější je, že se proslavil v roce 2016 poté, co se robot s názvem AlphaGo naučil hrát složitou a jemnou deskovou hru Go s nadlidskými dovednostmi a vynalézavostí.

Hassabis dnes říká, že jeho tým ve společnosti Google udělal větší krok vpřed – pro něj, společnost a doufejme i širší oblast AI. Gemini, model umělé inteligence, který Google dnes oznámil, podle něj otevírá neprošlapanou cestu v umělé inteligenci, která by mohla vést k zásadním novým průlomům.

„Jako neurovědec i počítačový vědec jsem roky chtěl zkusit a vytvořit jakousi novou generaci modelů umělé inteligence, které jsou inspirovány tím, jak interagujeme a chápeme svět všemi smysly,“ řekl Hassabis. WIRED před dnešním oznámením. Gemini je „velkým krokem k tomuto druhu modelu,“ říká. Google popisuje Gemini jako „multimodální“, protože dokáže zpracovávat informace ve formě textu, zvuku, obrázků a videa.

Počáteční verze Gemini bude ode dneška dostupná prostřednictvím chatbota společnosti Google Bard. Společnost říká, že nejvýkonnější verze modelu, Gemini Ultra, bude uvedena na trh příští rok a překonává GPT-4, model za ChatGPT, v několika běžných měřítcích. Videa vydaná společností Google ukazují, jak Gemini řeší úkoly, které zahrnují složité uvažování, a také příklady modelu kombinující informace z textových obrázků, zvuku a videa.

„Až dosud měla většina modelů jakousi aproximovanou multimodalitu trénováním samostatných modulů a jejich následným spojením,“ říká Hassabis v něčem, co se zdálo být zastřeným odkazem na technologii OpenAI. „To je pro některé úkoly v pořádku, ale v multimodálním prostoru nemůžete mít tak hluboké komplexní uvažování.“

OpenAI spustila v září upgrade na ChatGPT, který dal chatbotovi možnost pořizovat obrázky a zvuk jako vstup kromě textu. OpenAI nezveřejnila technické podrobnosti o tom, jak to GPT-4 dělá, ani technický základ svých multimodálních schopností.

Hra Catchup

Google vyvinul a spustil Gemini s pozoruhodnou rychlostí ve srovnání s předchozími projekty AI ve společnosti, poháněné nedávnými obavami z hrozby, kterou by pro budoucnost Google mohl představovat vývoj OpenAI a dalších.

Na konci roku 2022 byl Google považován za lídra v oblasti umělé inteligence mezi velkými technologickými společnostmi, přičemž řada výzkumníků umělé inteligence v této oblasti významně přispěla. Generální ředitel Sundar Pichai prohlásil, že jeho strategie pro společnost je „AI na prvním místě“ a Google úspěšně přidal AI do mnoha svých produktů, od vyhledávání po chytré telefony.

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com

Související příspěvky

Dokáže se umělá inteligence podívat na vaši sítnici a diagnostikovat Alzheimerovu chorobu? Eric Topol doufá, že ano

Daniela Amodei ze společnosti Anthropic věří, že trh odmění bezpečnou umělou inteligenci

Co se stane, když jsou vaši spolupracovníci agenty AI

Propojení dat, IT a řízení: objevte program MSc Management IT

Mohli jste zmeškat

Dokáže se umělá inteligence podívat na vaši sítnici a diagnostikovat Alzheimerovu chorobu? Eric Topol doufá, že ano

Daniela Amodei ze společnosti Anthropic věří, že trh odmění bezpečnou umělou inteligenci

Co se stane, když jsou vaši spolupracovníci agenty AI

Jon M. Chu říká, že AI nemohla vytvořit jeden z nejlepších momentů Wicked

NABÍZÍME VÁM UMÍSTĚNÍ SEO A PR ČLÁNKŮ

Naše projekty

Naše projekty