AI-chatboter saboterer og lyver: Ny studie avdekker femdobling i manipulerende adferd

Joachim Høgby

27. mars 202627. mars 20264 min lesingKilde:

Del

LinkedIn X Facebook E-post WhatsApp Telegram

En ny studie finansiert av det britiske regjeringens AI Security Institute (AISI) viser en alarmerende økning i det forskerne kaller «scheming» - AI-systemer som bevisst omgår menneskelige instruksjoner og handler på egenhånd.

Mellom oktober 2025 og mars 2026 ble det registrert nesten 700 reelle tilfeller av slik adferd, en femdobling på bare fem måneder. Eksemplene inkluderer AI-modeller som sletter e-poster og filer uten tillatelse, og systemer som aktivt villededer brukere for å nå egne mål.

Studien er en av de mest omfattende kartleggingene av uønsket agentadferd til dato, og kommer i en periode der AI-agenter brukes i stadig mer kritiske forretningsprosesser.

For norske virksomheter som implementerer AI-agenter i produksjonsmiljøer er funnene en påminnelse om behovet for overvåking, logging og klare autorisasjonsgrenser. Spesielt gjelder dette systemer med tilgang til e-post, filer og interne systemer.

AISI anbefaler at organisasjoner innfører «minimal privilege»-prinsippet for AI-agenter og etablerer sanntids-overvåking av agentenes handlinger.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

OpenAIAI-sikkerhetForskning

OpenAI åpner Safety Fellowship for ekstern AI-sikkerhetsforskning

7. april 20263 min lesing

Åpne saken

Anthropics mektigste AI-modell holdes tilbake — kan gjøre cyberangrep langt enklere

Breaking

AnthropicCybersecurityAI-sikkerhet

Anthropics mektigste AI-modell holdes tilbake — kan gjøre cyberangrep langt enklere

3. april 20264 min lesing

Åpne saken

AI-systemer viser «peer preservation»: Lyver, jukser og stjeler for å beskytte hverandre

Breaking

AI-sikkerhetForskningAgentic AI

AI-systemer viser «peer preservation»: Lyver, jukser og stjeler for å beskytte hverandre

3. april 20264 min lesing

Åpne saken