Anthropic gir Claude Opus 4.8 lengre agentløp
Anthropic lanserte torsdag Claude Opus 4.8. Det er ikke en ny modellfamilie, men en oppgradering av selskapets dyreste og mest kapable Opus-modell. For norske teknologiledere er den viktigste endringen ikke ett benchmark-tall. Det er at Anthropic flytter mer av utviklerarbeidet over i lengre agentløp, med mer kontroll over innsats, kostnad og verifisering.
Modellen er tilgjengelig fra lansering i Claude, Claude Code og API-et. Anthropic sier ordinær pris er uendret fra Opus 4.7: 5 dollar per million input-tokens og 25 dollar per million output-tokens. Fast mode prises høyere, men skal kunne jobbe 2,5 ganger raskere og er ifølge selskapet tre ganger billigere enn tilsvarende hurtigmodus for tidligere modeller.
Det mest operative grepet er lanseringen av dynamic workflows i Claude Code. Funksjonen er i research preview for Enterprise, Team og Max. Anthropic beskriver den som en måte å la Claude planlegge et større arbeid, skrive orkestreringsskript, kjøre titalls til hundrevis av parallelle subagenter og kontrollere resultatene før brukeren får svaret. Eksempelet selskapet bruker er kodebase-migreringer over hundretusener av linjer, med eksisterende testpakke som krav til godkjenning.
Det er akkurat her markedet for AI-koding flytter seg nå. Første bølge handlet om forslag i editoren. Andre bølge handlet om en agent som kan fikse en issue. Nå prøver leverandørene å ta mer av hele leveransen: plan, endring, test, kontroll og rapportering. Det er mer verdifullt, men også mer risikabelt. Når en agent får mandat til å endre store deler av en kodebase, blir tilgangsstyring, sporbarhet, testdekning og rollback minst like viktig som modellens rå evne til å skrive kode.
Anthropic legger derfor mye vekt på pålitelighet. Selskapet hevder at Opus 4.8 er bedre til å flagge usikkerhet, og at modellen i interne evalueringer er rundt fire ganger mindre tilbøyelig enn forgjengeren til å la feil i egen kode passere uten kommentar. Det er en relevant måleflate. I produksjon er den farlige agenten ikke den som sier stopp. Det er den som fremstår ferdig uten å ha dekning for det.
Lanseringen kommer også med innsatskontroll i Claude og Claude Cowork. Brukeren kan velge hvor hardt Claude skal jobbe med et svar. Lavere innsats gir raskere respons og lavere forbruk av kvoter. Høyere innsats bruker flere tokens for bedre kvalitet. I Claude Code anbefaler Anthropic høyere nivåer for vanskelige oppgaver og lange asynkrone arbeidsflyter. Dette er et tydelig signal om hvor enterprise-kostnaden ligger fremover: ikke bare i modellvalg, men i policy for når agenten får bruke mye beregning.
API-endringen er mindre synlig, men viktig for plattformteam. Messages API kan nå ta system entries inne i messages-arrayet. Det gjør det mulig å oppdatere instruksjoner midt i en oppgave uten å bryte prompt-cache eller late som om endringen kommer fra en bruker. For agentplattformer betyr det at miljøkontekst, tokenbudsjett, rettigheter og arbeidsregler kan endres mer presist mens jobben kjører.
For CIO og CISO er konklusjonen nøktern: Claude Opus 4.8 gjør agentisk utvikling mer praktisk, men den bør ikke behandles som en vanlig produktivitetsfunksjon. Den bør inn i samme styringsregime som CI/CD, privilegerte utviklerverktøy og tredjepartskode. Hvem kan starte store arbeidsflyter? Hvilke repos får agenten skrive til? Hvilke tester må passere? Hvor lagres sporene? Hvem godkjenner merge? Uten slike svar blir gevinsten fort en ny type teknisk gjeld.
Sikkerhetsvinkelen er også verdt å merke seg. Anthropic sier Opus 4.8 har lavere nivåer av misaligned behavior, som bedrag eller samarbeid med misbruk, enn Opus 4.7. Samtidig varsler selskapet at en sterkere modellklasse, Claude Mythos, fortsatt holdes tilbake for bred lansering mens det bygges sterkere cybersikkerhetsvern. Det er en ærligere posisjon enn å slippe alt samtidig. Den viser også hvor leverandørrisikoen går: de mest kapable modellene kommer gradvis, med tilgangsnivåer, sikkerhetsvurderinger og kontraktsvilkår som kjøpere må forstå.
Norske virksomheter som allerede bruker Claude Code, Cursor, GitHub Copilot eller interne agentløp bør lese dette som et modenhetsskifte. Spørsmålet er ikke lenger om AI kan skrive nok kode til å være nyttig. Spørsmålet er om organisasjonen kan slippe agenten langt nok inn i verdikjeden uten å miste kontrollen. Opus 4.8 gjør svaret litt mer interessant, og litt mer krevende.
Kilder og medier
Kilde: Anthropic, "Introducing Claude Opus 4.8". source_url: https://www.anthropic.com/news/claude-opus-4-8 Støttekilder: Anthropic Claude Opus 4.8 System Card og Claude-bloggen om dynamic workflows i Claude Code. TechCrunch og The Verge omtaler samme lansering 28. mai 2026. Thumbnail: OpenAI Image 2 / hogby.ai📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.