Breaking

CIO CISOCTOStyreAnthropicClaudeAI SecurityCybersecurityMITRE ATT&CKAI AgentsAgentic AIThreat IntelligenceKodeagenterDevSecOpsAI GovernanceRisikostyringLeverandørstyringObservabilityEnterprise AIIncident Response

Anthropic kartlegger AI-angrep i ATT&CK

Joachim Høgby

12. juni 202612. juni 20264 min lesingKilde: Anthropic Red

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Anthropic har publisert en ny analyse av hvordan angripere bruker store språkmodeller i cyberoperasjoner. Den viktigste nyheten er ikke at angripere ber modeller skrive kode. Det visste alle. Nyheten er at Anthropic nå har mappet misbruk av Claude mot MITRE ATT&CK og forsøker å måle hvor mye AI faktisk løfter en angriper.

Analysen bygger på 832 kontoer Anthropic stengte for cybermisbruk fra mars 2025 til mars 2026. Selskapet sier aktivitetene ble mappet til 13.873 observasjoner, 482 unike ATT&CK-teknikker og alle 14 taktikker i rammeverket. Det gir et sjeldent innblikk i hva AI-misbruk ser ut som i praksis, ikke bare i laboratoriet.

Funnene er ubehagelige for virksomheter som fortsatt behandler AI-sikkerhet som en policy i et intranett. Andelen aktører Anthropic klassifiserer som middels eller høy risiko økte fra 33 prosent i første halvdel av perioden til 56 prosent i andre halvdel. Selskapet tolker det som et tegn på at AI gjør det lettere å gjennomføre mer avanserte operasjoner.

Fra skript til orkestrering

Det mest brukte mønsteret var fortsatt tidligfase arbeid: utvikling av kapabiliteter, skadevare, obfuskering og innsamling av lokale data. Anthropic oppgir at 574 av 832 aktører brukte AI til å utvikle kapabiliteter, og at 560 brukte modellen i forbindelse med skadevareutvikling. Obfuskering dukket opp hos 64,7 prosent, innsamling av data fra lokale systemer hos 55,9 prosent og forsøk på å svekke forsvar hos 54,9 prosent.

Det betyr ikke at de mest alvorlige sakene handler om volum. Anthropic peker på et annet skille: aktørene blir farligere når modellen kobles inn i en arbeidsflyt som kan ta beslutninger og kjede sammen steg. Selskapet skriver at høy risiko i økende grad handler om «scaffolding», altså kode, verktøy, arkitektur og automasjon rundt modellen.

For CISO-er er det poenget verdt å ta med seg. En enkelt prompt om PowerShell er ikke det samme som en agent som har tilgang til repoer, terminal, CI/CD, skykontoer, dokumentasjon og interne hemmeligheter. Risikoen flytter seg fra selve modellen til systemet modellen får lov til å operere i.

ATT&CK mangler språk for autonome agenter

Anthropic mener også at dagens MITRE ATT&CK-rammeverk ikke fanger det som gjør autonome AI-angrep spesielt farlige. Rammeverket har ikke egne ID-er for autonom orkestrering av en kill chain, sanntidsvalg av neste pivot eller AI-styrt utførelse uten menneskelig inngripen.

Det er et praktisk problem. Mange sikkerhetsteam bygger deteksjon, rapportering og modenhetsmåling rundt ATT&CK. Hvis de nye mønstrene ikke passer godt inn i taksonomien, blir de også lettere å undervurdere i styrerapporter og risikomatriser. Man ender med å måle gamle teknikker, mens den nye risikoen ligger i hvordan teknikkene bindes sammen.

Lateral movement er et godt eksempel. Anthropic så at bare 54 av 832 aktører brukte modeller til lateral movement. Det er lavt volum. Likevel var dette den sterkeste markøren for høy risiko. Aktører som brukte AI på denne måten hadde i snitt en risikoscore på 56,4, mot 46,8 for resten av utvalget.

Det samme mønsteret gjelder andre aktiviteter sent i angrepsløpet. De er mindre vanlige enn obfuskering og skadevarebygging, men langt mer interessante for forsvarere. Når AI går fra å hjelpe med forberedelser til å påvirke handlinger i et levende miljø, bør alarmnivået opp.

Konsekvensen for norske virksomheter

For norske ledere er dette først og fremst en styringssak. Virksomheter bør ikke bare spørre leverandører om modellen er trygg. De bør spørre hva agenten kan gjøre, hvilke verktøy den kan bruke, hvor prompt- og handlingslogger lagres, og hvordan virksomheten kan stoppe en arbeidsflyt før den utfører skade.

Det gjelder særlig kodeagenter og interne assistenter med tilgang til utviklingsmiljøer. Claude Code, Cursor, Copilot, Gemini CLI og egne agentoppsett bør behandles som en del av angrepsflaten. De trenger tilgangsstyring, logging, miljøgrenser, hemmelighetshåndtering og tydelige regler for hva som aldri skal kjøres automatisk.

Sikkerhetsteam bør også oppdatere deteksjonslogikken. Det holder ikke å lete etter klassiske indikatorer på skadevare. Man må se etter overgangen fra tekstgenerering til operasjonell bruk: verktøykall, terminalkommandoer, API-kall, filskriving, repo-endringer, forsøk på credential discovery og agentsteg som bygger videre på tidligere funn.

Innkjøp bør ta med dette i kravspesifikasjonene. En enterprise-AI-leverandør som tilbyr agenter uten eksport av hendelser, beviskjede, policykontroller og kill switch, bør få et vanskelig møte. Det er ikke nok med en sikkerhetswhitepaper. Drift trenger observerbarhet.

Et tidlig bilde av neste trusselmodell

Anthropic lanserer også en egen risikomodell, AI Risk Enablement Score, som kombinerer tre signaler: trusselprofil, modellens bidrag til mulig skade og potensiell eller observert effekt. Poenget er ikke å spå om et angrep lykkes. Poenget er å prioritere hvilke AI-assisterte mønstre forsvarere bør bry seg mest om.

Det er riktig retning. Tradisjonell cyberrisiko er ofte bygget for systemer der mennesker styrer tempoet. Agentbaserte angrep endrer tempo, skala og koblingen mellom observasjon og handling. Da trenger også sikkerhetsarbeidet nye mål.

Saken er ikke at alle virksomheter må frykte autonome AI-angrep i morgen tidlig. Saken er at byggesteinene allerede finnes i vanlige utviklerverktøy og API-er. Når de kobles til riktige tilganger, blir skillelinjen mellom «assistert arbeid» og «operasjonell autonomi» tynn.

For CIO og CISO er anbefalingen enkel: kartlegg hvor AI-agenter kan handle på vegne av ansatte, logg alt som kan bli bevis, og sett tekniske grenser før bruken skalerer. Det er billigere enn å forklare etterpå hvorfor en agent hadde mer tilgang enn et menneske noen gang ville fått.

Kilder og medier

Anthropic Red: «Mapping AI-enabled cyber threats: Insights from the LLM ATT&CK Navigator». Primærkilde: https://red.anthropic.com/2026/attack-navigator/
MITRE ATT&CK er rammeverket Anthropic bruker som referanse i analysen.
Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

Breaking

CIOCISOAI-sikkerhet

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

NVIDIA, Microsoft og flere partnere starter Open Secure AI Alliance. Målet er åpne verktøy for AI-forsvar, sårbarhetshåndtering og respons på agentangrep.

27. juli 20264 min lesing

NVIDIA Blog

Åpne saken

AI-modellerAgenterOpenAI

OpenAI viser ChatGPT Work som agent for ekte arbeidsflyt

Sam Altman beskriver ChatGPT Work som en agent som bruker historikk, bygger en fullstack-side, koordinerer valg og klargjør Gmail-utkast fra én mobilprompt.

27. juli 20264 min lesing

Sam Altman / OpenAI

Åpne saken

CIOCISOAI-modeller

NVIDIA: Nemotron 3 Ultra slår åpne modeller i chipdesign-koding

NVIDIA hevder Nemotron 3 Ultra gir høyest treffsikkerhet og lavest tokenbruk blant åpne modeller i agentisk RTL-koding. Det peker rett mot flaskehalsen i chipdesign.

27. juli 20265 min lesing

NVIDIA Technical Blog

Åpne saken