OpenAI umožňuje některým uživatelům vyzkoušet novou funkci ChatGPT, která využívá svou umělou inteligenci k ovládání webového prohlížeče k rezervaci výletů, nákupu potravin, shánění výhodných nabídek a mnoha dalších online pracích.
Nový nástroj s názvem Operator je agentem umělé inteligence: spoléhá na model umělé inteligence vyškolený na textu i na obrázcích, aby interpretoval příkazy a zjišťoval, jak k jejich provádění použít webový prohlížeč. OpenAI tvrdí, že má potenciál automatizovat mnoho každodenních úkolů a pracovních pochůzek.
Operátor OpenAI následuje konkurenční verze společností Google a Anthropic, které prokázaly ty, které jsou schopny používat web. Agenti umělé inteligence jsou široce považováni za další evoluční fázi pro umělou inteligenci po chatbotech a mnoho společností naskočilo do hype vlaku tím, že je nabízí. Ve většině případů mají velmi omezené schopnosti a jednoduše používají jazykový model k automatizaci věcí, které se běžně dělají s běžným softwarem.
„AI se vyvíjí z tohoto nástroje, který by mohl odpovědět na vaše otázky, na nástroj, který je také schopen jednat ve světě a provádět složité, vícestupňové pracovní postupy,“ říká Peter Welinder, viceprezident pro produkt ve společnosti OpenAI. „Uvidíme velký dopad na produktivitu lidí – ale také na kvalitu práce, kterou jsou lidé schopni vykonávat.“
OpenAI připouští, že poskytnutí přístupu ChatGPT k webovému prohlížeči přináší nová rizika, a říká, že Operator se někdy může chovat špatně. Uvádí, že zavedla různá nová ochranná opatření a plánuje postupné rozšiřování schopností operátora.
Welinder a Yash Kumar, vedoucí produktu a inženýrství pro OpenAI’s Computer Using Agent, říkají, že plánem je poučit se z toho, jak lidé tento nástroj používají. Uznávají, že nástroj by mohl provádět nechtěné rezervace nebo nákupy, ale dodávají, že hodně práce bylo vynaloženo na zajištění toho, aby se zeptal, než udělá cokoliv riskantního. „Vrátí se mi a požádá o potvrzení, než podnikne kroky, které by mohly být nevratné,“ říká Kumar.
OpenAI dnes také vydala novou „systémovou kartu“, která nastiňuje problémy, které mohou nastat s Operatorem. Patří mezi ně možnost neporozumět příkazům nebo se odchýlit od toho, na co se uživatel ptá; ke zneužití uživateli; nebo být cílem kyberzločinců.
„Také to představuje neuvěřitelné množství bezpečnostních problémů,“ říká Kumar. „Protože vaše oblast vektoru útoku a oblast vektoru rizika se značně zvětšují.“
Operator bude zpočátku k dispozici jako „náhled výzkumu“ pro uživatele ChatGPT s účtem Pro, který stojí statných 200 $ měsíčně. Společnost říká, že plánuje rozšířit přístup a zároveň nástroj pomalu zavádět, protože během toho nevyhnutelně udělá nějaké chyby.
V několika ukázkách Operator ukázal potenciál AI převzít aktivnější roli webového pomocníka. Nástroj obsahuje vzdálený webový prohlížeč a chatovací okno pro komunikaci s uživatelem.
Na žádost WIRED byl operátor požádán, aby si zarezervoval cestu vlakem Amtrak z New Havenu, Connecticut, do Washingtonu, DC. Přešel na správnou webovou stránku a správně zadal potřebné informace, aby vyvolal rozvrh, a poté požádal o další pokyny. Pokud by byl uživatel přihlášen na web Amtrak nebo do profilu prohlížeče s uloženými informacemi o kreditní kartě, operátor by mohl pokračovat a rezervovat si vstupenku – ačkoli je navržen tak, aby nejprve požádal o povolení.
Kumar požádal operátora, aby si zarezervoval stůl v restauraci Beretta v San Franciscu. Program přešel na webovou stránku OpenTable, našel správnou restauraci a vyhledal dostupnost, než se zeptal, co dělat dál. OpenAI říká, že uzavřela partnerství s řadou oblíbených webů, včetně OpenTable, aby zajistila, že na nich Operator bude fungovat hladce.
Nový nástroj je založen na modelu GPT-4o AI OpenAI, který dokáže vnímat prohlížeč a webovou stránku a konverzovat pomocí psaného textu. Tento nástroj zahrnuje další školení, které má pomoci pochopit, jak provádět úkoly online. OpenAI také zpřístupní svého Computer Use Agent prostřednictvím svého API.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com