Hopp til hovedinnhold
 AI-nyheter, ferdig filtrert for ledere
SISTE:

OpenAI flytter GPT-5.5, Codex og agenter inn i Amazon Bedrock • OpenAI beklager manglende varsling før Tumbler Ridge-skytingen • DeepSeek åpner V4 Preview med 1M kontekst og API-kompatibilitet

NVIDIA slipper Nemotron 3 Nano Omni for multimodale AI-agenter
CIOAIOpen SourceInfrastructure

NVIDIA slipper Nemotron 3 Nano Omni for multimodale AI-agenter

JH
Joachim Høgby
28. april 202628. april 20263 min lesingKilde:

NVIDIA lanserte 28. april Nemotron 3 Nano Omni, en åpen multimodal modell som skal fungere som «øyne og ører» i agentiske systemer. Modellen samler tekst, bilder, lyd, video, dokumenter, grafer og skjermgrensesnitt i én perception-modell, i stedet for at agenten må hoppe mellom separate modeller for hvert format.

Hva er nytt

Nemotron 3 Nano Omni er bygget som en 30B-A3B hybrid mixture-of-experts-modell med 256K kontekst. NVIDIA sier modellen er tilgjengelig fra 28. april via Hugging Face, OpenRouter, build.nvidia.com og mer enn 25 partnerplattformer.

Poenget er ikke at modellen skal erstatte alle store språkmodeller. NVIDIA posisjonerer den som et multimodalt delsystem i en agentstack, brukt sammen med modeller som Nemotron 3 Super og Ultra eller proprietære modeller. Den skal tolke skjermopptak, dokumenter, lyd, video og visuelle grensesnitt raskere og billigere enn en kjede av separate modeller.

NVIDIA hevder opptil 9 ganger høyere throughput enn andre åpne omni-modeller med samme interaktivitet. Selskapet peker også på resultater innen dokumentforståelse, video og lyd, men tallene bør leses som leverandørbenchmarks til de er testet i egne arbeidsflyter.

Hvorfor dette betyr noe

For virksomheter som bygger agenter, er multimodal input ofte den dyre og skjøre delen. Kundeserviceopptak, PDF-er, skjermbilder, regneark, video og tale må forstås før agenten kan handle. Hvis én åpen modell kan håndtere mer av dette med lavere latency og kost, blir produksjonsagenter enklere å drifte.

Dette treffer særlig virksomheter med krav til lokal kontroll, egen hosting og dokumenttunge prosesser. Det er ikke nok å ha en smart toppmodell. Agenten trenger et robust sanseapparat.

Kilde og datovalidering

Den opprinnelige kilden er NVIDIAs egen bloggpost "NVIDIA Launches Nemotron 3 Nano Omni Model", publisert 28. april 2026. NVIDIA publiserte også en teknisk blogg samme dato med modellarkitektur, tilgjengelighet og benchmark-henvisninger. Saken er innenfor 48-timerskravet.

Kilder: https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/ og https://developer.nvidia.com/blog/nvidia-nemotron-3-nano-omni-powers-multimodal-agent-reasoning-in-a-single-efficient-open-model

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.