NVIDIA slipper Nemotron 3 Nano Omni for multimodale AI-agenter
NVIDIA lanserte 28. april Nemotron 3 Nano Omni, en åpen multimodal modell som skal fungere som «øyne og ører» i agentiske systemer. Modellen samler tekst, bilder, lyd, video, dokumenter, grafer og skjermgrensesnitt i én perception-modell, i stedet for at agenten må hoppe mellom separate modeller for hvert format.
Hva er nytt
Nemotron 3 Nano Omni er bygget som en 30B-A3B hybrid mixture-of-experts-modell med 256K kontekst. NVIDIA sier modellen er tilgjengelig fra 28. april via Hugging Face, OpenRouter, build.nvidia.com og mer enn 25 partnerplattformer.
Poenget er ikke at modellen skal erstatte alle store språkmodeller. NVIDIA posisjonerer den som et multimodalt delsystem i en agentstack, brukt sammen med modeller som Nemotron 3 Super og Ultra eller proprietære modeller. Den skal tolke skjermopptak, dokumenter, lyd, video og visuelle grensesnitt raskere og billigere enn en kjede av separate modeller.
NVIDIA hevder opptil 9 ganger høyere throughput enn andre åpne omni-modeller med samme interaktivitet. Selskapet peker også på resultater innen dokumentforståelse, video og lyd, men tallene bør leses som leverandørbenchmarks til de er testet i egne arbeidsflyter.
Hvorfor dette betyr noe
For virksomheter som bygger agenter, er multimodal input ofte den dyre og skjøre delen. Kundeserviceopptak, PDF-er, skjermbilder, regneark, video og tale må forstås før agenten kan handle. Hvis én åpen modell kan håndtere mer av dette med lavere latency og kost, blir produksjonsagenter enklere å drifte.
Dette treffer særlig virksomheter med krav til lokal kontroll, egen hosting og dokumenttunge prosesser. Det er ikke nok å ha en smart toppmodell. Agenten trenger et robust sanseapparat.
Kilde og datovalidering
Den opprinnelige kilden er NVIDIAs egen bloggpost "NVIDIA Launches Nemotron 3 Nano Omni Model", publisert 28. april 2026. NVIDIA publiserte også en teknisk blogg samme dato med modellarkitektur, tilgjengelighet og benchmark-henvisninger. Saken er innenfor 48-timerskravet.
Kilder: https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/ og https://developer.nvidia.com/blog/nvidia-nemotron-3-nano-omni-powers-multimodal-agent-reasoning-in-a-single-efficient-open-model
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.