Google gjør Gemini til agentplattform: 3.5 Flash flytter inn i søk, kode og bedrift
Google bruker I/O 2026 til å flytte Gemini fra modellnyhet til operativ arbeidsflate.
Selskapet lanserte tirsdag Gemini 3.5 Flash, første modell i en ny 3.5-serie. Den korte versjonen er enkel: Google vil at samme modell skal drive søk, koding, bedriftsagenter og lange arbeidsprosesser. Det er ikke bare en ny chatbot. Det er et forsøk på å gjøre Gemini til laget der arbeid faktisk blir planlagt, utført og kontrollert.
Det er derfor denne saken betyr mer for norske ledere enn enda en modelltabell. Google gjør agentfunksjoner tilgjengelige på tre flater samtidig: for vanlige brukere i Gemini-appen og AI Mode i Google Search, for utviklere i Antigravity, Gemini API, AI Studio og Android Studio, og for virksomheter i Gemini Enterprise Agent Platform og Gemini Enterprise.
Når en modell går inn i både søk, kodeverktøy og enterprise-plattform på samme dag, endres innkjøpsspørsmålet. CIO må ikke bare spørre hvilken modell som svarer best. Spørsmålet blir hvor agentene får lov til å jobbe, hvilke systemer de kan kalle, hvordan oppgaver logges, og hvem som eier risikoen når agenten gjør noe galt.
Hva Google faktisk lanserte
Gemini 3.5 Flash er tilgjengelig fra 19. mai, ifølge Google. 3.5 Pro brukes internt og skal komme neste måned.
Google beskriver Flash som en modell for lange, agentiske oppgaver. Den skal kunne planlegge, bygge og iterere over flere steg. Selskapet peker særlig på koding, apputvikling, vedlikehold av kodebaser, dokumentarbeid og økonomiprosesser.
Tallene Google oppgir er aggressive. Modellen skal slå Gemini 3.1 Pro på krevende kode- og agentbenchmarks, blant annet Terminal-Bench 2.1 med 76,2 prosent, GDPval-AA med 1656 Elo og MCP Atlas med 83,6 prosent. Den oppgis også til 84,2 prosent på CharXiv Reasoning for multimodal forståelse. Google sier i tillegg at 3.5 Flash leverer fire ganger høyere output-hastighet enn andre frontier-modeller, målt i tokens per sekund, og ofte til under halvparten av kostnaden.
Dette er leverandørtall, ikke en uavhengig revisjon. Men retningen er viktig. Modellkonkurransen flytter seg fra rene svar til kostnad per ferdig arbeidsflyt. Det er en annen type konkurranse. Den treffer IT-budsjett, arkitektur og styring direkte.
Agentene flyttes inn i bedriften
Det mest interessante er ikke at Google har en raskere modell. Det mest interessante er hvor den settes inn.
I Antigravity skal 3.5 Flash kunne bruke subagenter til å løse større oppgaver parallelt. Google viser eksempler der modellen kategoriserer ustrukturerte data, flytter eldre kode til Next.js og bygger interaktive grensesnitt. I bedriftssammenheng peker Google på piloter og bruk hos Shopify, Macquarie Bank, Salesforce, Ramp, Xero og Databricks.
Eksemplene sier mye om hvor markedet går. Shopify bruker subagenter til analyse av handelsdata. Macquarie Bank piloterer onboarding basert på dokumenter på over 100 sider. Salesforce integrerer 3.5 Flash i Agentforce for mer komplekse enterprise-oppgaver med flere subagenter og verktøykall. Databricks bruker agentiske arbeidsflyter til å hente sanntidsinformasjon, analysere store datasett, finne feil og foreslå tiltak.
For norske virksomheter er dette en forhåndsvisning av 2026-budsjettene. Agentprosjekter vil ikke lenger selges som demoer i et isolert chatvindu. De vil komme som standardfunksjoner i søk, sky, CRM, utviklingsmiljøer, dataplattformer og kontorpakker.
Da blir styringsjobben mer krevende. Hver agent trenger identitet, rettigheter, datagrense, logging, godkjenning og stoppknapp. Hvis ikke blir gevinstcaset fort et sikkerhets- og complianceproblem med pent grensesnitt.
Google viser også skalaen bak presset
I Sundar Pichais I/O-innlegg setter Google lanseringen inn i et større bilde. Selskapet sier at det nå prosesserer over 3,2 kvadrillioner tokens per måned på tvers av sine flater, opp fra rundt 480 billioner året før. Over 8,5 millioner utviklere bygger månedlig med Googles modeller. Modell-API-ene behandler omtrent 19 milliarder tokens per minutt. Google sier også at mer enn 375 Google Cloud-kunder hver har prosessert over én billion tokens de siste tolv månedene.
Dette er ikke småskala AI lenger. Dette er produksjonsvolum.
Pichai oppgir også at Google forventer rundt 180 til 190 milliarder dollar i capex i år, mot 31 milliarder dollar i 2022. En viktig del er Googles egne TPU-er. Selskapet sier at TPU 8t er rettet mot trening, TPU 8i mot inferens, og at treningssystemet kan skaleres over mer enn én million TPU-er globalt.
For ledere betyr det at AI ikke lenger kan behandles som en ren programvarelisens. Modellvalg henger sammen med infrastruktur, kapasitet, pris, datalokasjon og leverandørmakt. Det er akkurat det samme mønsteret hogby.ai har skrevet om i compute-sakene denne uken: regnekraft blir et strategisk innkjøp, ikke bare en teknisk ressurs.
Den norske ledervinkelen
Google prøver å eie hele kjeden: modell, agentplattform, utviklerverktøy, søk, Workspace, sky og spesialisert silisium. Det gir tempo og integrasjon. Det gir også låsing.
Norske CIO-er bør derfor lese Gemini 3.5-lanseringen som en styringssak, ikke som en produktnyhet. Tre beslutninger bør opp på bordet raskt.
Først: hvilke arbeidsflyter kan få agentstøtte uten at agenten får direkte beslutningsmakt over penger, kunder, sikkerhet eller regulatoriske forpliktelser?
Deretter: hvilke systemer får agentene røre? MCP, API-er, dokumentlager, kodebaser og økonomisystemer må behandles som privilegerte flater. Agenttilgang uten god IAM, logging og revisjon er en snarvei til rot.
Til slutt: hvordan måles gevinsten? Google selger lavere kostnad og høyere fart. Styret bør kreve konkrete måltall: spart tid, færre feil, raskere saksgang, bedre kvalitet og dokumentert kontroll. Ikke bare flere tokens.
Gemini 3.5 Flash kan bli en sterk modell. Det avgjørende for norske virksomheter er likevel ikke benchmarken. Det avgjørende er om de klarer å bygge en kontrollmodell rundt agentene før agentene blir standard i verktøyene folk allerede bruker.
Kilder og medier
- Primærkilde: Google, «Gemini 3.5: frontier intelligence with action», publisert 19. mai 2026 kl. 17:45 UTC: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
- Bakgrunn/kontekst: Google, «I/O 2026: Welcome to the agentic Gemini era», publisert 19. mai 2026 kl. 17:45 UTC: https://blog.google/innovation-and-ai/sundar-pichai-io-2026/
- Google oppgir egne benchmark-, kostnads- og volumtall. Disse er ikke uavhengig verifisert i denne saken.
- Thumbnail: OpenAI Image 2 / hogby.ai.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.