Google viser hvordan AI-agenter slippes inn i produksjonsdrift
Google har publisert en sjelden konkret beskrivelse av hvordan selskapets SRE-miljø tar i bruk agentisk AI i produksjonsdrift. Det er ikke en vanlig produktlansering. Det er et innblikk i hvordan et av verdens mest erfarne driftsmiljøer prøver å flytte AI-agenter fra demo og kodehjelp til hendelseshåndtering, varsling, runbooks og risikovurdering.
Saken er viktig fordi mange virksomheter nå går inn i den farlige mellomfasen. AI brukes allerede til kode, dokumentasjon og analyse. Neste steg er agenter som leser produksjonsdata, foreslår tiltak og etter hvert utfører deler av driftsarbeidet. Det kan gi raskere feilretting og lavere operasjonell kostnad. Det kan også gi nye feiltyper, uklare ansvarslinjer og automasjon som endrer produksjonsmiljøer raskere enn kontrollapparatet rekker å forstå.
Google beskriver bakteppet slik: moderne systemer er mer distribuerte, mer komplekse og mer avhengige av kontinuerlige endringer. AI-generert kode gjør også at utviklere kan levere langt mer kode. Det gir flere muligheter til å introdusere pålitelighetsproblemer. Samtidig kan AI brukes til å forstå produksjonsmiljøer bedre, prioritere hendelser og redusere manuelt arbeid.
Det mest interessante er hvor Google ikke vil bruke AI. Selskapet skriver at prosesser som allerede er godt automatisert med klassiske, deterministiske systemer, ikke skal byttes ut bare fordi agentisk AI er tilgjengelig. Det er et viktig poeng for CIO-er og CISO-er. Den riktige styringsmodellen er ikke å putte en agent inn i alle prosesser. Den er å skille mellom stabil automasjon, beslutningsstøtte og autonom handling.
I reliability design ser Google for seg agenter som kan oppdage problemer tidligere i design-, lanserings- og deployfasen. For høyrisiko-tjenester betyr ikke det at mennesker fjernes fra prosessen. Det betyr at AI kan gjøre forarbeid, finne svakheter og foreslå tiltak før mennesker må ta den endelige vurderingen. For virksomheter med modne endringsprosesser er dette en realistisk vei inn: la agenten redusere støy og forberede beslutninger før den får lov til å endre noe selv.
Runbooks og produksjonsdokumentasjon er et annet konkret område. Google sier at SRE-teamet har utviklet AI-agenter som kontinuerlig overvåker og forbedrer playbooks basert på faktisk bruk under hendelser. Agentene kan også generere nye playbooks fra hendelser. Det er en praktisk bruk som mange norske driftsmiljøer kan kjenne igjen. Dokumentasjonen finnes ofte, men den er ujevn, foreldet eller ikke oppdatert etter siste incident. AI kan hjelpe, men bare hvis endringene spores og kvalitetssikres.
På varsling går Google lenger enn tradisjonelle terskelverdier. For tjenester med mange ulike kundemønstre er statiske alarmer ofte for grove. Google beskriver bruk av AI-basert anomalideteksjon, der agenter samler signaler og modeller vurderer avvik fra normal oppførsel. Varsler kan deretter grupperes, berikes og sendes videre til autonome alert handlers som kan håndtere eller mitigere enkelte problemer. Her ligger både gevinsten og risikoen. Færre falske alarmer er verdifullt. Men når en agent får lov til å mitigere, må virksomheten vite nøyaktig hvilke data den vurderer, hvilke rettigheter den har, og hvordan handlingen kan rulles tilbake.
Google peker selv på dette. Selskapet sier at agentene må være transparente på hvilke data de evaluerer og hvordan, og at det må finnes kontroller som hindrer uønskede endringer i produksjonsstate. Det er kjernen for CISO og IT-ledelse. En driftagent uten sterk identitet, avgrensede rettigheter og revisjonsspor er ikke en effektivisering. Det er en ny privilegert aktør i infrastrukturen.
Incident management er et annet område Google løfter frem. AI-agenter kan overvåke kommunikasjonsflater under en hendelse, oppsummere informasjon, støtte handover mellom SRE-er, lage utkast til postmortems og håndtere intern og ekstern kommunikasjon. Dette er nyttig fordi incident-arbeid ofte bryter sammen i overlevering og dokumentasjon. Samtidig må virksomheter være varsomme med kommunikasjon ut av organisasjonen. En agent som oppsummerer internt er én ting. En agent som formulerer kundekommunikasjon under nedetid, krever tydelige godkjenningsledd.
Google beskriver også agenter for incident investigation og i enkelte tilfeller autonom mitigering. Disse agentene bruker observability-data som logger, monitoring og tracing, i tillegg til systemtopologi, avhengigheter og historiske hendelser. Selskapet har laget AI Insights, et system som henter læring fra tidligere incidents og gjør innsikten tilgjengelig for agenter. Det er et godt mønster: agenten bør ikke bare ha tilgang til sanntidsdata, men også til organisasjonens historiske feil, risikokategorier og beslutninger.
Designprinsippene Google lister opp bør leses som en minimumsliste for alle som vurderer agentisk drift. Agentene må møte krav til sikkerhet, personvern og safety på samme nivå som dagens systemer og mennesker. De må ha sterk identitet, roller og rettigheter. De må ha egne SLO-er og backup-planer. De må kunne forklare hvorfor de gjorde en handling, hvilke alternativer som ble vurdert, og hvorfor alternativer ble forkastet. Beredskapsplaner må også dekke AI-feil.
Dette gjør saken større enn Google Cloud. Produksjonsdrift er et av de første stedene agentisk AI kan få reell operasjonell makt. Hvis den lykkes, kan den redusere incident-tid, forbedre postmortems og gi bedre risikobilde. Hvis den styres svakt, får virksomheten en automatisert aktør med tilgang til produksjonsdata og mulig endringskraft.
For norske ledere er konklusjonen enkel: start med kontrollmodellen før agenten slippes inn. Definer identitet, tilgang, logging, godkjenning, rollback, kvalitetsevaluering og beredskap. Bruk agentisk AI først der den kan observere, oppsummere og foreslå. Flytt den gradvis mot handling bare der prosessen tåler feil, og der ansvaret fortsatt er plassert hos mennesker med mandat.
Kilder og medier
Primærkilde: Google Cloud Blog, «AI in SRE: Where and how Google is deploying agentic AI to improve operations», publisert 29. mai 2026: https://cloud.google.com/blog/products/devops-sre/how-google-sre-is-using-agentic-ai-to-improve-operations
Kildekreditering: Google Cloud Blog. Thumbnail: OpenAI Image 2 / hogby.ai.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.