Nye agentfeil gir RCE og SSRF i AI-verktøy

Breaking

CIO CISOCTOStyreAI AgentsAnythingLLMUTCPAutoGPTRCESSRFTool CallingSupply Chain SecurityAI InfrastructureDevSecOpsAI GovernanceEnterprise AI

Nye agentfeil gir RCE og SSRF i AI-verktøy

Joachim Høgby

29. mai 202629. mai 20264 min lesingKilde: NIST NVD / GitHub Security Advisory

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Tre ferske sårbarheter i AI-agentverktøy viser hvor fort risikoen flytter seg fra selve modellen til verktøyene den får bruke. NISTs sårbarhetsdatabase publiserte torsdag kveld nye CVE-er for AnythingLLM, Universal Tool Calling Protocol og AutoGPT. Ingen av dem handler om at en språkmodell svarer feil. De handler om grensen mellom prompt, agent, filsystem, nettverk og kostnadskontroll.

Den mest alvorlige saken gjelder AnythingLLM før versjon 1.13.0. Plattformen brukes til å gjøre egne dokumenter og datakilder tilgjengelige for LLM-er i chat og agentløp. Ifølge NVD sendte agentferdigheten for filsystemsøk et LLM-styrt søkemønster videre til ripgrep uten å skille søkestrengen fra kommandolinjevalg med en ---separator. Det høres lite dramatisk ut. Det er det ikke. Hvis mønsteret starter med bindestrek, tolker ripgrep det som et valg. NVD beskriver at et mønster som --pre=/bin/sh kan gjøre søkeverktøyet til en skriptkjører. Sammen med en søskenfunksjon for å skrive filer kan en angriper som får chatte med en agent i et miljø med filsystem-plugin aktivert, kjøre kommandoer inne i AnythingLLM-servercontaineren.

GitHub-rådgivningen gir feilen høy alvorlighet, med CVSS 7,5. NVD beskriver at feilen er rettet i AnythingLLM 1.13.0. For virksomheter som tester interne kunnskapsagenter, er dette en presis påminnelse: et agentverktøy er ikke bare et hjelpemiddel for modellen. Det er et programmatisk grensesnitt mot systemet agenten kjører i. Når modellen kan påvirke argumenter til kommandolinjeverktøy, filoperasjoner eller API-kall, må input behandles som fiendtlig, også når brukeren er autentisert.

Den andre feilen gjelder @utcp/http, TypeScript-implementasjonen av Universal Tool Calling Protocol, før versjon 1.1.2. NVD beskriver en blind SSRF-sårbarhet i skillet mellom manuell discovery og faktisk tool invocation. registerManual() validerer discovery-URL-en mot krav om HTTPS og loopback-regler. Men når verktøyet senere kalles, gjenbrukes toolCallTemplate.url fra OpenAPI-spesifikasjonen uten ny validering. En legitim HTTPS-hostet OpenAPI-spec kan dermed peke servers[0].url mot for eksempel 127.0.0.1 eller cloud metadata-adresser. Resultatet er at agenten kan sendes mot interne tjenester fra innsiden av miljøet.

CVSS-scoren er moderat, 4,7. Likevel bør ikke norske CISO-er lese dette som en uinteressant lavrisikofeil. SSRF i en agentarkitektur får en annen praktisk konsekvens enn SSRF i en isolert webapp. Agenten er ofte satt opp nettopp for å nå interne API-er, dokumentlagre og orkestreringsflater. Hvis valideringen bare skjer ved discovery, men ikke ved hvert kall, kan prompt injection, forgiftet tool-discovery eller en kompromittert spesifikasjon bli nok til å flytte trafikk inn mot systemer som aldri skulle eksponeres.

Den tredje feilen gjelder AutoGPT før versjon 0.6.59. Her er sikkerhetsbruddet mindre klassisk, men viktig for styring. Ifølge NVD kan endepunktet POST /api/blocks/{block_id}/execute kjøre blokker uten å trekke credits, uavhengig av brukerens saldo. Kredittsjekken som finnes i vanlig grafkjøring blir ikke nådd når blokker kalles direkte via eksternt API. For en intern agentplattform kan slike feil bli mer enn en faktureringsglipp. De kan undergrave rate limits, godkjenningsflyter, human-in-the-loop-kontroller og kostnadstak.

Fellesnevneren er at agentkontroller må ligge på laveste relevante nivå, ikke bare i UI, promptpolicy eller orkestrator. Filverktøy må ha allowlistede operasjoner, eksplisitt argumentseparering og isolert runtime. Tool-calling må validere mål, skjema og egress ved hvert kall, ikke bare ved registrering. Kostnads- og risikogrenser må håndheves i API-et som faktisk utfører arbeidet.

For CIO-er betyr dette at pilotregimet for AI-agenter må ligne mer på produksjonsklar programvare enn på chatbot-testing. Spør leverandørene hvor agenten kjører, hvilke verktøy den kan kalle, hvordan argumenter valideres, hvor secrets ligger, hvilke nettverk den kan nå, og hvilke logger som viser faktisk verktøybruk. For CISO-er er minimumstiltakene konkrete: oppgrader AnythingLLM til 1.13.0 eller nyere, @utcp/http til 1.1.2 eller nyere og AutoGPT til 0.6.59 eller nyere. Skru av agent-mode og filsystemverktøy der de ikke er nødvendige. Blokker cloud metadata-endepunkter og interne administrasjonsflater med egress-regler. Kjør agentmiljøer uten sensitive mounts, med egne secrets og med klare grenser mot produksjonsnett.

Dette er ikke en grunn til å stoppe agentprosjekter. Det er en grunn til å slutte å behandle dem som ufarlige sideprosjekter. Når en agent får verktøy, får den også en angrepsflate. Den må eies.

Kilder og medier

Primærkilde: NIST NVD / GitHub Security Advisory, CVE-2026-48116: https://nvd.nist.gov/vuln/detail/CVE-2026-48116

GitHub Security Advisory, AnythingLLM GHSA-6hrp-7mw6-8v59: https://github.com/Mintplex-Labs/anything-llm/security/advisories/GHSA-6hrp-7mw6-8v59

NIST NVD, CVE-2026-45366 / UTCP SSRF: https://nvd.nist.gov/vuln/detail/CVE-2026-45366

GitHub Security Advisory, typescript-utcp GHSA-r8j5-8747-88cm: https://github.com/universal-tool-calling-protocol/typescript-utcp/security/advisories/GHSA-r8j5-8747-88cm

NIST NVD, CVE-2026-45023 / AutoGPT block execution: https://nvd.nist.gov/vuln/detail/CVE-2026-45023

GitHub Security Advisory, AutoGPT GHSA-8pjg-mfqm-vrhr: https://github.com/Significant-Gravitas/AutoGPT/security/advisories/GHSA-8pjg-mfqm-vrhr

Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

AICIOCISO

Artificial Analysis: Claude Opus 5 tar ledelsen på agentbenchmark

Artificial Analysis plasserer Claude Opus 5 øverst på AA-Briefcase for agentisk kunnskapsarbeid. Viktigst for ledere: bedre analyse, men lange kjøretider og høy innsats gjør styring avgjørende.

26. juli 20265 min lesing

Artificial Analysis

Åpne saken

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken