A Google egy új, az ún. „User Alignment Critic” védelmi réteg bevezetését tervezi a Chrome böngészőjébe, így biztosítva védelmet a hamarosan megjelenő AI-ügynök böngészési funkciókhoz.
Az AI-ügynök böngészés egy olyan új mód, amelyben az AI-ügynök úgy kerül konfigurálásra, hogy az automatikusan elvégezze a felhasználók számára a többlépéses feladatokat, beleértve a weboldalak közötti navigációt, azok tartalmának olvasását, gombokra történő kattintásokat, űrlapok kitöltését stb. A „User Alignment Critic” egy különálló LLM model (Large Language Model), amely „nagy megbízhatóságú rendszerkomponensként” működik.
A Google AI-alapú asszisztense, a Gemini szeptemberben került integrálásra a Chrome böngészőbe. Akkoriban a Google bejelentette, hogy tervezik az AI-ügynök böngészés képesség bevezetését a Chrome-ban és ennek védelmére került most hozzáadásra egy új biztonsági architektúra. Mindennek célja, hogy csökkentsék a közvetlen prompt injektálás kockázatát, hogy a rosszindulatú oldaltartalmak ne manipulálhassák az AI-ügynököket nem biztonságos műveletek végrehajtására, például felhasználói adatok közzétételére vagy nem megbízható tranzakciók végrehajtására. Ez az új biztonsági rendszer egy rétegzett védelmi megközelítést alkalmaz, amely ötvözi a determinisztikus szabályokat, a modell szintű védelmet, az izolációs határokat és a felhasználói felügyeletet.
Az új architektúra fő pillérei:
- User Alignment Critic: Egy második izolált Gemini modell, amely minden olyan műveletet megvizsgál, amit az elsődleges AI-ügynök készül végrehajtani. Ha a művelet kockázatosnak vagy a felhasználói kérés szempontjából irrelevánsnak tűnik, akkor újrapróbálkozást rendel el, vagy átadja a vezérlést a felhasználónak.
- Source Sets: Korlátozza az ügynökök webhelyekhez történő hozzáférését és csak bizonyos weboldalakkal és elemekkel engedélyezi az interakciókat, így akadályozva meg a weboldalak közötti adatszivárgásokat és a kompromittált ügynökök széles hatókörét.
- User oversight: Szenzitív weboldalak, például banki portálok vagy jelszókezelővel történő bejelentkezést igénylő weboldalak esetén a Chrome szünetelteti a folyamatokat és manuális megerősítést kér a felhasználóktól azok folytatásához.
- Prompt injection detection: A Chrome-ban található külön erre a célra dedikált osztályozó rendszer átvizsgálja az oldalakat közvetett és azonnali injection kísérletek után kutatva, hogy blokkolja a feltételezett rosszindulatú műveleteket és csalással kapcsolatos tartalmakat.
A Google elmondása szerint ezen törekvései mellett prioritásként kezelik azokat a támadásokat is, amelyek tartós károkat okozhatnak, például a csalásokkal kapcsolatos pénzügyi tranzakciókat és a hitelesítő adatok kiszivárgását. A Google mérnökei azonnali visszajelzést kapnak a támadások sikerességi arányairól és képesek gyorsan reagálni rájuk a Chrome automatikus frissítési mechanizmusán keresztül kiadott javításokkal. A biztonsági kutatások ösztönzésének keretein belül pedig akár 20.000 dolláros jutalmat is felajánl a Google azoknak, akik feltörik az új rendszerét.
