Anthropic vil ha nødbrems for AI som bygger AI

Breaking

CIO CISOCTODPOStyreAnthropicClaudeClaude CodeAI AgentsAgentic AIRecursive Self-improvementAI GovernanceAI SecuritySoftware DevelopmentRuntime SecurityModel RiskLeverandørstyringRisikostyringEnterprise AIBeredskap

Anthropic vil ha nødbrems for AI som bygger AI

Joachim Høgby

5. juni 20265. juni 20265 min lesingKilde: Anthropic Institute

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Anthropic vil ha nødbrems for AI som bygger AI

Anthropic gjør noe uvanlig. Selskapet legger frem interne tall som viser hvor mye av AI-utviklingen som allerede er overtatt av AI, og kobler dem direkte til spørsmålet om hvordan verden skal bremse hvis utviklingen løper fra styringen.

I en ny analyse fra Anthropic Institute skriver selskapet at Claude per mai 2026 står bak mer enn 80 prosent av koden som merges inn i Anthropics produksjonskodebase. Før Claude Code ble lansert i research preview i februar 2025, var andelen i lave enkeltsifre. Samtidig sier Anthropic at ingeniørene i snitt shipper åtte ganger så mye kode per kvartal som de gjorde i perioden 2021 til 2025.

Det er ikke bare en produktivitetsfortelling. Anthropic bruker tallene som bevis på at AI-systemer allerede akselererer utviklingen av nye AI-systemer. Selskapet kaller endepunktet rekursiv selvforbedring: et system som i praksis kan designe, bygge og forbedre sin egen etterfølger. Anthropic sier tydelig at verden ikke er der ennå. De sier også at det ikke er uunngåelig. Men selskapets poeng er at institusjonene som skal styre dette kan være for trege.

Reuters omtalte saken torsdag kveld som et krav om koordinerte planer for å kunne stanse eller bremse AI-utvikling hvis risikoen øker. Den delen er viktigere enn tallet på kode alene. Anthropic ber ikke bare om mer intern policy. Selskapet vil bygge forskning, samtaler og verifikasjonssystemer som kan gjøre en troverdig pause mulig på tvers av ledende AI-laboratorier og land.

Fra kodeassistent til produksjonsmotor

Det mest konkrete tallet er kodeandelen. Anthropic skiller mellom eksperimentell kode og kode som faktisk går inn i produksjon. Selskapet skriver at over 80 prosent av linjene som merges til produksjonskodebasen kan tilskrives Claude. Anthropic-ledere har offentlig anslått høyere tall, men instituttet bruker det mer konservative produksjonsmålet fordi attribusjonen har hull.

Anthropic forsøker også å dempe den enkle tolkningen. Linjer med kode er et dårlig mål på kvalitet. Åtte ganger mer kode betyr ikke åtte ganger bedre produktivitet. Likevel er retningen vanskelig å overse. Når Claude ikke bare skriver små snippets, men løser oppgaver med uklar spesifikasjon, feilsøker produksjonshendelser og får koden gjennom review, endrer det rollen til utvikleren.

Selskapet beskriver en utviklingslinje fra chatboter som hjalp med små oppgaver, via kodeagenter som kunne endre filer, til autonome agenter som kjører kode, tester og delegerer timer med arbeid til andre agenter. Det er nettopp denne lukkede sløyfen som er styringsproblemet. Når AI først kan gjøre store deler av arbeidet, flytter flaskehalsen seg fra skriving til valg av mål, kvalitetssikring, prioritering og kontroll.

For norske teknologiledere er dette et varsel om at AI-koding ikke lenger bør behandles som et verktøyvalg på utviklernes laptop. Det er en produksjonsmodell. Den trenger egne kontroller for kodeeierskap, review, logging, tilgang, testdekning, avhengigheter, secrets og hendelseshåndtering.

Mennesket blir styringslag, ikke tastatur

Anthropic skriver at Claude allerede kan få et delvis åpent problem og finne en metode selv. I research kan Claude gjennomføre et godt spesifisert eksperiment, men selskapet sier at det fortsatt er store gap når modellen skal velge hvilke mål som er verdt å forfølge. Det er en viktig nyanse. Menneskelig dømmekraft er fortsatt kjernen i det som skjer. Men den flytter seg oppover i stacken.

Det betyr at ledere får et annet styringsproblem enn mange budsjetter og policyer er laget for. Spørsmålet er ikke lenger bare hvem som får bruke Copilot, Claude Code eller Cursor. Spørsmålet er hvor mye arbeid en agent kan starte, endre og fullføre før et menneske må inn. Det handler om mandat, ikke bare lisens.

I praksis bør virksomheter skille mellom tre nivåer. Først assistanse, der AI foreslår og mennesket gjør. Deretter delegert arbeid, der AI endrer kode, lager pull requests og kjører tester innenfor tydelige rammer. Til slutt autonom drift, der agenten kan feilsøke, rette og deploye eller påvirke produksjonsmiljøer. Mange selskaper har allerede hoppet fra første til andre nivå uten at governance, IAM og revisjon har fulgt med.

Anthropic peker også på at menneskelig review kan bli flaskehalsen. Hvis en agent kan produsere kode raskere enn mennesker kan forstå den, vil organisasjonen enten miste fart eller senke kontrollnivået. Begge deler har kostnad. Svaret er ikke å fjerne mennesker, men å gjøre review-laget mer maskinelt, målbart og uavhengig. Automatisk kodegjennomgang, policy-as-code, isolerte sandkasser og robuste rollback-løp blir basis, ikke pynt.

Nødbremsen er et tillitsproblem

Den mest politiske delen av Anthropics tekst handler om pause. Selskapet skriver at det ville være nyttig om verden hadde mulighet til å bremse eller midlertidig pause frontier-utvikling for å gi samfunnsstrukturer og alignment-forskning tid til å ta igjen teknologien. Men en ensidig pause kan bare flytte forspranget til mindre forsiktige aktører.

Derfor handler nødbremsen om verifikasjon. Flere store laboratorier, i flere land, måtte kunne stoppe under like vilkår og kunne kontrollere at andre faktisk stopper. Anthropic sammenligner problemet med våpenkontroll, men sier AI er vanskeligere å verifisere fordi treningsløp kan skjules langt lettere enn missilsiloer. Det er en nøktern og ubehagelig observasjon.

For styrer og konsernledelser er parallellen direkte. Også internt i en virksomhet må en AI-pause være verifiserbar. Det holder ikke å sende en e-post om at agentbruk er stanset. Man må vite hvilke modeller som kjører, hvor de kjører, hvilke API-nøkler som er aktive, hvilke agenter som har tilgang til repoer, data og produksjonssystemer, og hvem som kan slå dem av.

Dette er spesielt relevant for regulerte bransjer. Banker, energi, helse, offentlig sektor og industri får ikke bare et produktivitetsløft. De får en ny type operasjonell risiko, der feil kan oppstå raskere, forplante seg bredere og være vanskeligere å forklare etterpå.

Hva norske ledere bør gjøre nå

Første steg er å kartlegge faktisk agentbruk. Ikke spør bare hvilke verktøy som er godkjent. Se på repo-aktivitet, pull requests, tokens, API-kall, lokale CLI-verktøy, nettleserutvidelser og integrasjoner mot Slack, Teams, Jira, GitHub, GitLab og interne systemer. Skyggebruk er sannsynlig.

Andre steg er å sette mandatgrenser. En agent som kan lese kode har én risikoprofil. En agent som kan skrive kode har en annen. En agent som kan kjøre kommandoer, åpne nettverk, lese secrets eller påvirke produksjon er en driftsrisiko. Dette må inn i tilgangsstyring, ikke bare i en AI-policy.

Tredje steg er å bygge en intern nødbrems. Den bør inkludere nøkkelrotasjon, mulighet til å deaktivere agentintegrasjoner, sentral logging av agenthandlinger, krav til menneskelig godkjenning ved produksjonsendringer, og en plan for å fryse modell- eller leverandørbruk ved sikkerhetshendelser.

Fjerde steg er å oppdatere leverandørstyringen. Spør ikke bare leverandøren hvilken modell de bruker. Spør hvordan agenthandlinger logges, hvordan de begrenser verktøytilgang, hvordan de håndterer prompt injection, hvordan de gjør rollback, og om kunden kan stoppe eller isolere agentfunksjoner uten å stoppe hele tjenesten.

Anthropic har egeninteresse i å ramme inn dette alvorlig. Selskapet konkurrerer om kunder, talent og politisk tillit. Likevel er signalet verdt å ta på alvor nettopp fordi det kommer fra en aktør som selv har mest å tjene på at utviklingen fortsetter. Når et frontier-lab sier at AI allerede skriver mesteparten av produksjonskoden deres og at verden trenger en verifiserbar brems, er det ikke en akademisk øvelse. Det er en driftsbeskrivelse fra innsiden av kappløpet.

For norske virksomheter er konklusjonen enkel: AI-agenten er på vei ut av pilotrommet og inn i produksjonslinjen. Da må den styres som produksjon. Ikke som et eksperiment med fin logo og lav terskel.

Kilder og medier

Primærkilde: Anthropic Institute, "When AI builds itself", publisert 4. juni 2026. https://www.anthropic.com/institute/recursive-self-improvement

Top-tier verifisering: Reuters, "Anthropic says AI labs need coordinated plan to halt development if risks rise", publisert 4. juni 2026. https://www.reuters.com/technology/artificial-intelligence/anthropic-says-ai-labs-need-coordinated-plan-halt-development-if-risks-rise-2026-06-04/

Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

AICIOCISO

Artificial Analysis: Claude Opus 5 tar ledelsen på agentbenchmark

Artificial Analysis plasserer Claude Opus 5 øverst på AA-Briefcase for agentisk kunnskapsarbeid. Viktigst for ledere: bedre analyse, men lange kjøretider og høy innsats gjør styring avgjørende.

26. juli 20265 min lesing

Artificial Analysis

Åpne saken

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken