Když jsem konečně mohl experimentovat s automatickým procházením (tentokrát doopravdy), vzal jsem za výchozí bod návrhy digitálních prací od Googlu a vybral jsem si online úkoly, které by mohly být užitečné v mém vlastním životě.
Při každé interakci s generativními nástroji umělé inteligence je kritický zdravý pocit skepse – a opatrnosti. Google dokonce obsahuje prohlášení o vyloučení odpovědnosti zapečené do svého chatbota Gemini, které uživatelům připomíná, že dělá chyby. Nástroj Automatické procházení jde ještě o krok dále. „Používejte Gemini opatrně a v případě potřeby převezměte kontrolu,“ zní trvalý text, který se zobrazuje na postranním panelu chatbota pokaždé, když je spuštěno Automatické procházení. „Jsi zodpovědný za Blížence během úkolů.“
Než to vyzkoušíte, musíte také myslet na bezpečnostní rizika spojená s tímto druhem automatizace. Generativní nástroje umělé inteligence jsou náchylné ke kompromitaci prostřednictvím rychlých injekčních útoků na škodlivé weby. Tyto útoky se snaží robota odvést od jeho úkolu. Potenciální zranitelnosti v Google Auto Browse nebyly plně prozkoumány externími výzkumníky, ale rizika mohou být podobná jako u jiných nástrojů AI, které převezmou kontrolu nad vaším počítačem.
Kromě toho dbejte zvýšené opatrnosti, pokud k nákupům používáte Automatické procházení. Google má zavedená ochranná opatření, která označují určité akce, jako je nákup věcí nebo zveřejňování na sociálních sítích, jako citlivé a vyžadující souhlas uživatele, aby mohly pokračovat. Přesto jsem si nebyl jistý, jak se bude robot chovat, a byl jsem znepokojený zmatkem, který by mohl potenciálně způsobit s mou kreditní kartou, nemluvě o tom, že mu v první řadě předám finanční informace.
Zde je první výzva, kterou jsem poslal s kartou v ruce:
Chci si dnes večer zarezervovat dva lístky na SF symfonii. Nechci platit za sezení v orchestru, ale vstupenky nemusí být nejlevnější. Vyberte si prosím dvě sedadla vedle uličky.
Je trochu bizarní sledovat, jak agent AI společnosti Google klikal na kartě. Nejprve jsem viděl, jak používá Gemini 3, nejnovější model Google, ke strategii a definování cílů, jako je získání dvou sedadel v uličce v symfonii, v textovém poli postranního panelu na několik sekund. Tento proces vypadá podobně jako chatbot používající „uvažovací“ model, který probírá kroky, které může podniknout, než se pohne vpřed. Poté začne klikání. Každý krok, který robot provede v rámci úkolu, je pro uživatele protokolován.
Schopnost funkce Auto Browse provádět vícekrokové úkoly bez toho, aby byla odstavena na vedlejší kolej, byla znatelně lepší než u podobných nástrojů agentů, které jsem testoval minulý rok. Přešel na správnou webovou stránku, vybral správný výkon a klikl na několik sekcí sedadel, aby změřil dostupnost. Vše uvedené v protokolu se zdálo být tím, co skutečně provedl.
Po několika minutách práce na lístcích na symfonii robot přestal klikat. Obdržel jsem upozornění, že mám převzít a stisknout tlačítko „objednat nyní“. Na první pohled nástroj AI zdánlivě přinesl to, o co jsem žádal, a poměrně rychle.
Ale kdybych si nepochybně objednala dvě sedadla, která si Auto Browse vybralo pro rande na symfonii, noc by s největší pravděpodobností skončila tím, že by mě můj přítel nechal spát na gauči.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com
