CIOAIOpen SourceInfrastructure

NVIDIA slipper Nemotron 3 Nano Omni for multimodale AI-agenter

Joachim Høgby

28. april 202628. april 20263 min lesingKilde:

Del

LinkedIn X Facebook E-post WhatsApp Telegram

NVIDIA lanserte 28. april Nemotron 3 Nano Omni, en åpen multimodal modell som skal fungere som «øyne og ører» i agentiske systemer. Modellen samler tekst, bilder, lyd, video, dokumenter, grafer og skjermgrensesnitt i én perception-modell, i stedet for at agenten må hoppe mellom separate modeller for hvert format.

Hva er nytt

Nemotron 3 Nano Omni er bygget som en 30B-A3B hybrid mixture-of-experts-modell med 256K kontekst. NVIDIA sier modellen er tilgjengelig fra 28. april via Hugging Face, OpenRouter, build.nvidia.com og mer enn 25 partnerplattformer.

Poenget er ikke at modellen skal erstatte alle store språkmodeller. NVIDIA posisjonerer den som et multimodalt delsystem i en agentstack, brukt sammen med modeller som Nemotron 3 Super og Ultra eller proprietære modeller. Den skal tolke skjermopptak, dokumenter, lyd, video og visuelle grensesnitt raskere og billigere enn en kjede av separate modeller.

NVIDIA hevder opptil 9 ganger høyere throughput enn andre åpne omni-modeller med samme interaktivitet. Selskapet peker også på resultater innen dokumentforståelse, video og lyd, men tallene bør leses som leverandørbenchmarks til de er testet i egne arbeidsflyter.

Hvorfor dette betyr noe

For virksomheter som bygger agenter, er multimodal input ofte den dyre og skjøre delen. Kundeserviceopptak, PDF-er, skjermbilder, regneark, video og tale må forstås før agenten kan handle. Hvis én åpen modell kan håndtere mer av dette med lavere latency og kost, blir produksjonsagenter enklere å drifte.

Dette treffer særlig virksomheter med krav til lokal kontroll, egen hosting og dokumenttunge prosesser. Det er ikke nok å ha en smart toppmodell. Agenten trenger et robust sanseapparat.

Kilde og datovalidering

Den opprinnelige kilden er NVIDIAs egen bloggpost "NVIDIA Launches Nemotron 3 Nano Omni Model", publisert 28. april 2026. NVIDIA publiserte også en teknisk blogg samme dato med modellarkitektur, tilgjengelighet og benchmark-henvisninger. Saken er innenfor 48-timerskravet.

Kilder: https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/ og https://developer.nvidia.com/blog/nvidia-nemotron-3-nano-omni-powers-multimodal-agent-reasoning-in-a-single-efficient-open-model

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

Breaking

CIOCISOAI-sikkerhet

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

NVIDIA, Microsoft og flere partnere starter Open Secure AI Alliance. Målet er åpne verktøy for AI-forsvar, sårbarhetshåndtering og respons på agentangrep.

27. juli 20264 min lesing

NVIDIA Blog

Åpne saken

AI-modellerAgenterOpenAI

OpenAI viser ChatGPT Work som agent for ekte arbeidsflyt

Sam Altman beskriver ChatGPT Work som en agent som bruker historikk, bygger en fullstack-side, koordinerer valg og klargjør Gmail-utkast fra én mobilprompt.

27. juli 20264 min lesing

Sam Altman / OpenAI

Åpne saken

CIOCISOAI-modeller

NVIDIA: Nemotron 3 Ultra slår åpne modeller i chipdesign-koding

NVIDIA hevder Nemotron 3 Ultra gir høyest treffsikkerhet og lavest tokenbruk blant åpne modeller i agentisk RTL-koding. Det peker rett mot flaskehalsen i chipdesign.

27. juli 20265 min lesing

NVIDIA Technical Blog

Åpne saken