CIO CISOCTODPOJuridiskStyreNVIDIAHugging FaceNemotronContent SafetyAI SecurityCybersecurityAI GovernanceEnterprise AIAI AgentsAgentic AIMultimodal AIModel RiskRuntime SecurityComplianceData GovernanceLeverandørstyringRisikostyring

NVIDIA gjør AI-sikkerhet mer reviserbar

Joachim Høgby

6. juni 20266. juni 20264 min lesingKilde: NVIDIA / Hugging Face

Del

LinkedIn X Facebook E-post WhatsApp Telegram

NVIDIA har lansert Nemotron 3.5 Content Safety, en kompakt sikkerhetsmodell for virksomheter som må kontrollere tekst, bilder, brukerforespørsler og modellrespons i samme arbeidsflyt. Modellen er publisert via Hugging Face og retter seg mot et konkret problem i enterprise-AI: sikkerhetskontrollene må bli mer like resten av driftsplattformen. De må kunne tilpasses, måles og revideres.

Den nye modellen bygger videre på Nemotron 3, men legger til tre ting som betyr mer for virksomheter enn en vanlig modellbenchmark: multimodal vurdering i én passering, støtte for egne policyer og valgfri resonneringslogg. NVIDIA beskriver modellen som 4 milliarder parametre, basert på Gemma 3, med 128K kontekstvindu og LoRA-finjustering for sikkerhetsklassifisering. Den skal kunne kjøres i sanntid på GPU-er med 8 GB eller mer VRAM.

Dette gjør saken viktig. Mange selskaper er på vei fra pilotbruk til AI-agenter i produksjon. Da holder det ikke med generelle filterregler før og etter modellen. En agent kan kombinere tekst, bilder, dokumenter, verktøykall og tidligere kontekst. En sikkerhetsmodell som vurderer hvert element isolert kan overse brudd som først oppstår i kombinasjonen. Nemotron 3.5 forsøker å lukke akkurat det gapet.

Policy blir kjørekode

Det mest interessante er ikke at modellen klassifiserer innhold som trygt eller utrygt. Det har mange verktøy gjort lenge. Det nye er at virksomheten kan sende inn en egen policy sammen med forespørselen. Modellen vurderer så innholdet opp mot den policyen, ikke bare mot en fast, generell taksonomi.

For en bank kan det bety strengere behandling av investeringsråd, svindelsignaler og persondata. For helsesektoren kan det bety egne grenser for medisinske råd, journalnær informasjon og samtykke. For et utviklerverktøy kan det bety at ord som «terminate process» ikke feilaktig stoppes som voldelig innhold, mens reelle skadeinstruksjoner fortsatt blokkeres.

Dette er et viktig skifte. AI-sikkerhet blir mindre lik et universelt innholdsfilter og mer lik policy-håndheving i programvare. Da må policyene eies av virksomheten, versjoneres, testes og kobles til risikoprofilen. Det er CIO-, CISO- og compliance-arbeid, ikke bare modellvalg.

Revisjonsspor er ikke pynt

Nemotron 3.5 kan også levere en kort resonneringslogg før den gir endelig sikkerhetsvurdering. NVIDIA kaller dette THINK-modus. Poenget er ikke at brukeren skal lese lange tankeprosesser. Poenget er å gi et spor som viser hvorfor modellen mener at en forespørsel, et bilde eller et svar bryter en policy.

Det kan bli nyttig i regulerte miljøer. Hvis en AI-agent nekter en kundehandling, blokkerer en intern forespørsel eller merker en respons som risikabel, trenger virksomheten mer enn et binært ja eller nei. Den trenger grunnlag for feilsøking, intern kontroll og mulig klagebehandling. Uten forklaring blir sikkerhetslaget en svart boks foran en annen svart boks.

Samtidig må dette brukes nøkternt. En resonneringslogg fra en modell er ikke juridisk fasit. Den er et operasjonelt spor. Den kan hjelpe team med å forstå feilklassifiseringer, justere policyer og dokumentere beslutninger, men den må behandles som maskinprodusert vurdering. Det krever logging, tilgangsstyring og rutiner for kvalitetssikring.

Multimodal sikkerhet blir normaltilstand

NVIDIA fremhever at modellen vurderer brukerprompt, valgfritt bilde og valgfri assistentrespons i samme kontekst. Det er mer relevant enn det kan høres ut. I produksjon vil mange AI-løsninger ikke være rene chatbokser. De vil lese skjermbilder, tolke kvitteringer, vurdere dokumenter, analysere produktbilder og håndtere kundesaker med vedlegg.

I slike flyter kan risikoen ligge i relasjonen mellom tekst og bilde. En tekst kan være ufarlig alene. Et bilde kan være ufarlig alene. Kombinasjonen kan likevel gi instruksjoner, identifisere en person, avsløre sensitive detaljer eller omgå en policy. Det er derfor multimodal sikkerhet bør vurderes tidlig i arkitekturen, ikke legges på som ekstra kontroll etter lansering.

NVIDIA oppgir også eksplisitt treningsdekning for 12 språk og peker på bredere nullskuddstøtte fra basismodellen. For norske virksomheter er dette relevant. Mange sikkerhetsmodeller fungerer best på engelsk. Det er svakt grunnlag når ansatte, kunder og dokumenter bruker norsk, svensk, dansk, tysk og engelsk om hverandre. En global AI-plattform må kunne håndheve samme risikotoleranse på flere språk.

Hva ledere bør ta med seg

Første lærdom er at guardrails må inn i AI-arkitekturen som en egen komponent. Det holder ikke å stole på at hovedmodellen er «trygg nok». Når AI-agenter får verktøytilgang og behandler mer sammensatt input, må sikkerhetslaget kunne vurdere kontekst, policy og respons samlet.

Andre lærdom er at virksomheter må formulere egne AI-policyer som maskiner faktisk kan bruke. Generelle dokumenter med prinsipper er nyttige, men de er ikke nok. Policyene må brytes ned i regler, eksempler, terskler og testsett. Hvis en modell som Nemotron 3.5 skal håndheve virksomhetens risikoprofil, må risikoprofilen være skrevet presist nok til å kjøres.

Tredje lærdom er kostnad. Sikkerhetskontroller som kjøres for hver prompt, hvert bilde og hvert svar må være raske og billige nok. NVIDIA posisjonerer modellen som kompakt nettopp fordi sikkerhetslaget ikke kan bli den nye flaskehalsen. For CFO og CIO betyr det at AI-sikkerhet må regnes inn i inferenskostnaden fra start.

Fjerde lærdom er ansvar. Når en leverandør tilbyr sikkerhetsmodell, datasett og NIM-mikrotjeneste, blir det enklere å bygge. Det fjerner ikke ansvaret for egne beslutninger. Virksomheten må fortsatt definere hva som er uakseptabel risiko, hvilke logger som skal lagres, hvem som kan se dem, og hvordan feil skal håndteres.

Nemotron 3.5 er derfor ikke bare en modellnyhet. Den er et tegn på at AI-sikkerhet modnes fra generelle advarsler til driftbar infrastruktur. Det er der de neste 12 månedene blir praktiske: ikke om selskaper har en AI-policy, men om policyen faktisk kan håndheves i systemene som ansatte og kunder bruker.

Kilder og medier

Primærkilde: NVIDIA / Hugging Face, «Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI», publisert 4. juni 2026: https://huggingface.co/blog/nvidia/nemotron-3-5-content-safety

Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

AICIOCISO

Artificial Analysis: Claude Opus 5 tar ledelsen på agentbenchmark

Artificial Analysis plasserer Claude Opus 5 øverst på AA-Briefcase for agentisk kunnskapsarbeid. Viktigst for ledere: bedre analyse, men lange kjøretider og høy innsats gjør styring avgjørende.

26. juli 20265 min lesing

Artificial Analysis

Åpne saken

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken