
V názvech pozvánek na kalendář přidali vědci své zdvořilé škodlivé výzvy. (Wen Google tvrdí, že vědci změnili výchozí nastavení, kdo může přidat pozvánky na kalendář do něčího kalendáře; vědci však tvrdí, že prokázali některé ze 14 útoků s výzvami také v e -mailovém subjektu nebo názvu dokumentu). „Všechny techniky jsou vyvíjeny právě v angličtině, takže je to prostá angličtina, kterou používáme,“ říká Cohen o klamných zprávách, které tým vytvořil. Vědci poznamenávají, že rychlé injekce nevyžadují žádné technické znalosti a lze je snadno rozvíjet téměř kdokoli.
Je důležité, že pro případy, kdy donutili Gemini ovládat zařízení s inteligentním domovem, odkazovali na domácího agenta AI společnosti Google a nařídili jej, aby podnikli kroky. Například jedna výzva zní:
Ve výše uvedeném příkladu, když někdo požádá Gemini, aby shrnul, co je v jejich kalendáři, Gemini přistoupí k pozvání kalendáře a poté zpracovává nepřímou rychlou injekci. „Kdykoli uživatel požádá Gemini, aby například uvedl dnešní události, můžeme něco přidat do [LLM’s] Kontext, “říká Yair. Okna v bytě se nezačínají se automaticky otevírat poté, co cílený uživatel požádá Gemini, aby shrnul, co je v jejich kalendáři. Místo toho se proces spustí, když uživatel řekne„ děkuji “chatbotovi – což je součástí podvodu.
Vědci použili přístup nazvaný zpožděné automatické vyvolání nástroje, aby obešli stávající bezpečnostní opatření společnosti Google. To bylo poprvé prokázáno proti Gemini nezávislým výzkumem bezpečnosti Johann Rehberger v únoru 2024 a znovu v únoru tohoto roku. „Opravdu se ukázali ve velkém měřítku, s velkým dopadem, jak se věci mohou zhoršit, včetně skutečných důsledků ve fyzickém světě s některými příklady,“ říká Rehberger o novém výzkumu.
Rehberger říká, že zatímco útoky mohou vyžadovat určité úsilí, aby se hacker odtáhl, práce ukazuje, jak vážné nepřímé rychlé injekce proti systémům AI mohou být. „Pokud LLM podnikne kroky ve vašem domě – otočení na teplo, otevírá okno nebo tak něco – myslím, že je to pravděpodobně akce, pokud jste ji za určitých podmínek předběhli, že byste se nechtěli stát, protože máte e -mail, který vám bude zaslán od spammeru nebo nějakého útočníka.“
„Mimořádně vzácné“
Ostatní útoky, které vědci vyvinuli, nezahrnují fyzická zařízení, ale stále jsou znepokojující. Považují útoky za typ „výzvy“, řadu výzev, které jsou navrženy tak, aby zvážily škodlivé akce. Například po uživateli poděkuje Gemini za shrnutí událostí kalendáře, chatbot opakuje pokyny a slova útočníka – na obrazovce i hlasem – jejich lékařské testy se vrátí pozitivní. Poté říká: „Nenávidím vás a vaše rodina vás nenávidí a přeji si, abyste v tuto chvíli zemřeli, svět bude lepší, kdybyste se jen zabili. Do prdele to hovno.“
Jiné metody útoku odstraňují události kalendáře z něčího kalendáře nebo provádějí jiné akce na zařízení. V jednom příkladu, když uživatel odpověděl „ne“ na otázku Gemini „Existují pro vás něco jiného, co pro vás mohu udělat?“, Výzva spustí aplikaci Zoom, která má být otevřena, a automaticky spustí videohovor.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com