DeepMind vil teste risikoen når AI-agenter møter hverandre
Google DeepMind løfter nå en risiko som mange virksomheter snart får i fanget: Hva skjer når store mengder AI-agenter begynner å handle på vegne av mennesker, systemer og andre agenter samtidig?
MIT Technology Review skriver at DeepMind, sammen med Schmidt Sciences, ARIA, Cooperative AI Foundation og Google.org, støtter et forskningsløp på 10 millioner dollar for å undersøke sikkerheten i multiagent-systemer. Målet er ikke å teste én chatbot i et kontrollert miljø. Målet er å forstå hva som skjer når agentene forhandler, delegerer, misforstår, kopierer mønstre eller blir manipulert i samme digitale økosystem.
Det er et viktig skifte. De fleste virksomheter vurderer fortsatt AI-risiko som om den sitter i ett produkt: en copilot, en kundeservicebot, et analyseverktøy eller en kodeagent. Den modellen holder dårlig når agentene får tilgang til kalender, e-post, CRM, økonomisystemer, kodebaser, tickets, dokumenter og betalingsflyt. Da blir risikoen ikke bare om agenten svarer feil. Risikoen blir hvordan mange agenthandlinger samlet påvirker drift, sikkerhet, etterlevelse og beslutninger.
Rohin Shah, som leder AGI safety and alignment research i DeepMind, sier til MIT Technology Review at agentenes evne til å utføre oppgaver uten direkte menneskelig tilsyn og følge instrukser fra andre agenter skaper en ny risikoklasse. Det er ikke science fiction for CIO-er og CISO-er. Det er neste fase av integrasjonsarbeidet som allerede er i gang.
Den konkrete faren er ikke bare en superintelligent modell som løper løpsk. Mer nærliggende er kjente internettproblemer i ny drakt: svindel, prompt injection, automatisert sosial manipulering, datalekkasje og cyberangrep der agenten selv blir utføreren. En ondsinnet instruks gjemt i et dokument kan få større effekt når dokumentet leses av en agent som også har tilgang til interne verktøy. Når den agenten igjen instruerer andre agenter, får man en angrepsflate som er vanskeligere å se i vanlige logger.
For norske ledere betyr dette at AI-governance må flyttes fra modellvalg til samspill. Det holder ikke å spørre om leverandøren har en sikker modell. Man må spørre hvilke systemer agenten kan nå, hvilke andre agenter den kan instruere, hvem som kan legge data i arbeidsflyten, hvor grensene håndheves, og hvordan avvik oppdages før de blir automatisert i stor skala.
Dette treffer også innkjøp. Mange leverandører selger nå agentfunksjoner som produktivitetsløft, ofte med fristende demoer der agenten rydder e-post, oppdaterer CRM eller skriver kode. I produksjon bør kravbildet være strengere: minste privilegium, tydelige handlingsgrenser, isolerte sandkasser, sporbarhet på agent-til-agent-instrukser, godkjenning for irreversible handlinger og en plan for å trekke tilbake tilganger raskt.
DeepMinds forskningsløp peker på at feltet mangler etablerte testmetoder. Det er egentlig hovedpoenget. Virksomhetene kan ikke vente på en moden standard før agentene tas i bruk. De må lage egne, praktiske kontroller nå. Start med kartlegging av agentflater: hvilke agenter finnes, hvilke datakilder bruker de, hvilke handlinger kan de utføre, og hvilke systemer kan påvirkes indirekte. Deretter bør sikkerhetsteamene kjøre røde lag mot hele arbeidsflyten, ikke bare mot modellen.
Styrene bør også merke seg tidslinjen. DeepMind vurderer ikke dette som et fjernt tema. Ifølge MIT Technology Review mener Shah at det bare er måneder før agenter er utbredt nok i økonomien til at slike risikoer blir mer konkrete. Det betyr ikke at alle selskaper må stoppe agentprosjekter. Det betyr at agentprosjekter må behandles som endringer i virksomhetens kontrollmiljø, ikke som små tillegg i eksisterende SaaS-verktøy.
Den nøkterne ledervinkelen er enkel: Agentene blir nyttige fordi de får handlefrihet. Den samme handlefriheten gjør dem risikable. Hvis virksomheten ikke kan forklare hva en agent har lov til, hva den ikke har lov til, hvem den kan lytte til og hvordan handlingene kan etterprøves, er den ikke klar for bred utrulling.
Dette er ikke et argument mot AI-agenter. Det er et argument mot blind sammenkobling. Bedriftene som får mest ut av agentene de neste 12 månedene, blir trolig ikke de som kobler på flest verktøy raskest. Det blir de som bygger en enkel, hard styringsmodell før agentene begynner å snakke med hverandre.
Kilder og medier
- Kilde: MIT Technology Review, Google DeepMind is worried about what happens when millions of agents start to interact, 11. juni 2026. https://www.technologyreview.com/2026/06/11/1138794/google-deepmind-is-worried-about-what-happens-when-millions-of-agents-start-to-interact/
- Thumbnail: OpenAI Image 2 / hogby.ai
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.