CIO CISOCTOStyreGoogle DeepMindAI AgentsMultiagent SystemsAI SecurityAI GovernancePrompt InjectionCybersecurityEnterprise AIAgentic AIRisikostyringLeverandørstyringZero TrustInternkontrollObservabilityCompliance

DeepMind vil teste risikoen når AI-agenter møter hverandre

Joachim Høgby

13. juni 202613. juni 20264 min lesingKilde: MIT Technology Review

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Google DeepMind løfter nå en risiko som mange virksomheter snart får i fanget: Hva skjer når store mengder AI-agenter begynner å handle på vegne av mennesker, systemer og andre agenter samtidig?

MIT Technology Review skriver at DeepMind, sammen med Schmidt Sciences, ARIA, Cooperative AI Foundation og Google.org, støtter et forskningsløp på 10 millioner dollar for å undersøke sikkerheten i multiagent-systemer. Målet er ikke å teste én chatbot i et kontrollert miljø. Målet er å forstå hva som skjer når agentene forhandler, delegerer, misforstår, kopierer mønstre eller blir manipulert i samme digitale økosystem.

Det er et viktig skifte. De fleste virksomheter vurderer fortsatt AI-risiko som om den sitter i ett produkt: en copilot, en kundeservicebot, et analyseverktøy eller en kodeagent. Den modellen holder dårlig når agentene får tilgang til kalender, e-post, CRM, økonomisystemer, kodebaser, tickets, dokumenter og betalingsflyt. Da blir risikoen ikke bare om agenten svarer feil. Risikoen blir hvordan mange agenthandlinger samlet påvirker drift, sikkerhet, etterlevelse og beslutninger.

Rohin Shah, som leder AGI safety and alignment research i DeepMind, sier til MIT Technology Review at agentenes evne til å utføre oppgaver uten direkte menneskelig tilsyn og følge instrukser fra andre agenter skaper en ny risikoklasse. Det er ikke science fiction for CIO-er og CISO-er. Det er neste fase av integrasjonsarbeidet som allerede er i gang.

Den konkrete faren er ikke bare en superintelligent modell som løper løpsk. Mer nærliggende er kjente internettproblemer i ny drakt: svindel, prompt injection, automatisert sosial manipulering, datalekkasje og cyberangrep der agenten selv blir utføreren. En ondsinnet instruks gjemt i et dokument kan få større effekt når dokumentet leses av en agent som også har tilgang til interne verktøy. Når den agenten igjen instruerer andre agenter, får man en angrepsflate som er vanskeligere å se i vanlige logger.

For norske ledere betyr dette at AI-governance må flyttes fra modellvalg til samspill. Det holder ikke å spørre om leverandøren har en sikker modell. Man må spørre hvilke systemer agenten kan nå, hvilke andre agenter den kan instruere, hvem som kan legge data i arbeidsflyten, hvor grensene håndheves, og hvordan avvik oppdages før de blir automatisert i stor skala.

Dette treffer også innkjøp. Mange leverandører selger nå agentfunksjoner som produktivitetsløft, ofte med fristende demoer der agenten rydder e-post, oppdaterer CRM eller skriver kode. I produksjon bør kravbildet være strengere: minste privilegium, tydelige handlingsgrenser, isolerte sandkasser, sporbarhet på agent-til-agent-instrukser, godkjenning for irreversible handlinger og en plan for å trekke tilbake tilganger raskt.

DeepMinds forskningsløp peker på at feltet mangler etablerte testmetoder. Det er egentlig hovedpoenget. Virksomhetene kan ikke vente på en moden standard før agentene tas i bruk. De må lage egne, praktiske kontroller nå. Start med kartlegging av agentflater: hvilke agenter finnes, hvilke datakilder bruker de, hvilke handlinger kan de utføre, og hvilke systemer kan påvirkes indirekte. Deretter bør sikkerhetsteamene kjøre røde lag mot hele arbeidsflyten, ikke bare mot modellen.

Styrene bør også merke seg tidslinjen. DeepMind vurderer ikke dette som et fjernt tema. Ifølge MIT Technology Review mener Shah at det bare er måneder før agenter er utbredt nok i økonomien til at slike risikoer blir mer konkrete. Det betyr ikke at alle selskaper må stoppe agentprosjekter. Det betyr at agentprosjekter må behandles som endringer i virksomhetens kontrollmiljø, ikke som små tillegg i eksisterende SaaS-verktøy.

Den nøkterne ledervinkelen er enkel: Agentene blir nyttige fordi de får handlefrihet. Den samme handlefriheten gjør dem risikable. Hvis virksomheten ikke kan forklare hva en agent har lov til, hva den ikke har lov til, hvem den kan lytte til og hvordan handlingene kan etterprøves, er den ikke klar for bred utrulling.

Dette er ikke et argument mot AI-agenter. Det er et argument mot blind sammenkobling. Bedriftene som får mest ut av agentene de neste 12 månedene, blir trolig ikke de som kobler på flest verktøy raskest. Det blir de som bygger en enkel, hard styringsmodell før agentene begynner å snakke med hverandre.

Kilder og medier

Kilde: MIT Technology Review, Google DeepMind is worried about what happens when millions of agents start to interact, 11. juni 2026. https://www.technologyreview.com/2026/06/11/1138794/google-deepmind-is-worried-about-what-happens-when-millions-of-agents-start-to-interact/
Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

StyreCIOAI-infrastruktur

Nvidia gir Sutskevers SSI mer regnekraft i AI-kappløpet

Safe Superintelligence får tilgang til Nvidias Vera Rubin-plattform og skal skalere forskningen kraftig. For styrer er saken et nytt tegn på at AI-ledelse styres av compute, kapital og tilgang.

28. juli 20264 min lesing

TechCrunch

Åpne saken

CISOCIOCybersikkerhet

Vercel viser prislappen på AI-drevet sårbarhetsjakt

Vercels DeepsecBench måler hvor godt ulike modeller finner sikkerhetsfeil i kode. Tallene viser at AI-skanning blir billigere, men at funnrate og styring fortsatt er harde krav.

28. juli 20264 min lesing

Vercel

Åpne saken

CIOStyreArbeidsliv

OpenAI måler hvordan AI flytter arbeid mellom roller

OpenAIs nye arbeidsrapport viser at ChatGPT-brukere i økende grad tar oppgaver fra andre fagområder. For ledere betyr det mindre stillingslogikk og mer styring av faktisk arbeid.

28. juli 20264 min lesing

OpenAI

Åpne saken