Breaking

CIO CISOCTOCFOStyreNVIDIACosmos 3Physical AIRoboticsAutonomous VehiclesVision AIWorld ModelsSynthetic DataEdge AIAI GovernanceAI SecurityOT SecurityLeverandørstyringRisikostyringEnterprise AI

NVIDIA åpner modellkrigen for fysisk AI

Joachim Høgby

1. juni 20261. juni 20264 min lesingKilde: NVIDIA Newsroom

Del

LinkedIn X Facebook E-post WhatsApp Telegram

NVIDIA har lansert Cosmos 3, en åpen grunnmodell for fysisk AI. Modellen er laget for roboter, autonome kjøretøy og vision-agenter som må forstå, simulere og handle i den fysiske verden.

Dette er ikke en vanlig modellnyhet for tekst og kontorarbeid. NVIDIA prøver å eie neste lag i AI-stakken: systemene som trener, tester og styrer maskiner som beveger seg, ser og påvirker fysiske miljøer.

Ifølge NVIDIA bygger Cosmos 3 på en såkalt mixture-of-transformers-arkitektur. Den kombinerer resonnering, verdenssimulering og handlingsprediksjon i samme system. Selskapet beskriver modellen som en fullt åpen “omnimodel” som kan forstå og generere tekst, bilder, video, lyd og handlinger. Målet er å korte ned utviklingsløp for fysisk AI fra måneder til dager ved å bruke syntetiske data, simulering og forhåndstrente modeller.

For norske ledere er poenget enkelt: AI-agenter er på vei ut av chatvinduet. Neste bølge handler om kameraer, roboter, lager, industri, bygg, transport og sikkerhetssystemer. Da holder det ikke å diskutere prompt-policy og lisenskostnader. Virksomheter må vite hvem som har ansvar når en modell påvirker en produksjonslinje, en logistikkflyt eller et fysisk sikkerhetsmiljø.

Hva NVIDIA faktisk lanserer

Cosmos 3 kommer i flere varianter. Cosmos 3 Super er rettet mot robotikk og autonome kjøretøy som trenger høy fysikkpresisjon og genereringskvalitet. Cosmos 3 Nano skal gi raskere video- og handlingsresonnering. Cosmos 3 Edge er varslet for sanntids inferens ute på kanten, men er ikke tilgjengelig ennå.

NVIDIA sier modellen kan brukes som tre ting: en vision-language-modell som forstår flere modaliteter, en verdensmodell som simulerer miljøer og fremtidige tilstander, og en ryggrad for world action-modeller som trener roboter til konkrete oppgaver.

Det er særlig viktig for bransjer med dyre, farlige eller trege testmiljøer. En robot på fabrikkgulvet kan ikke feile i stor skala mens den lærer. Et autonomt kjøretøy kan ikke testes bare i snille demonstrasjoner. Et overvåkingssystem i et sykehus, en havn eller et datasenter må tåle avvik, rot og dårlige data. Verdensmodeller skal gjøre mer av denne testingen mulig før systemene slippes inn i virkeligheten.

NVIDIA peker også på nye datasett for robotikk, fysikk, menneskelig bevegelse, autonom kjøring, lagertrygghet og romlig resonnering. I tillegg kobles Cosmos-plattformen til fysiske AI-agentferdigheter for blant annet neural scene reconstruction, defektbilde-generering og videoaugmentering.

Det høres teknisk ut, men konsekvensen er praktisk: leverandører får ferdige byggesteiner for å lage AI-systemer som ser avvik, simulerer mulige hendelser og foreslår eller utfører handlinger.

Åpen modell, lukket styringsproblem

NVIDIA markedsfører Cosmos 3 som åpen. Modellene skal kunne prøves på build.nvidia.com, lastes ned fra Hugging Face, tilpasses med Diffusers og ressurser på GitHub, og kjøres som NVIDIA NIM-mikrotjenester. Selskapet lanserer også Cosmos Coalition med blant andre Agile Robots, Black Forest Labs, Generalist, LTX, Runway og Skild AI.

Åpenhet betyr likevel ikke enkel styring. Når modeller kan lastes ned, tilpasses og kjøres på tvers av skyløsninger, edge-noder og leverandørmiljøer, blir kontrollspørsmålene mer krevende. Hvilken modellversjon ble brukt? Hvilke syntetiske data ble generert? Hvem godkjente endringen? Hva skjer når modellen fungerer i simulering, men ikke i et vått lager, et støvete verksted eller en travel havneterminal?

Dette er en CIO- og CISO-sak, ikke bare en robotikknyhet. Fysisk AI vil kreve nye krav til logging, endringskontroll, rolle- og tilgangsstyring, testbevis og beredskap. For styret handler det om ansvar og risikotoleranse. For CFO handler det om hvor raskt automatiseringsgevinster kan tas ut uten å bygge skjult operasjonell risiko.

Norske virksomheter som allerede bruker kameraanalyse, autonome inspeksjoner, lagerautomatisering eller digitale tvillinger bør merke seg retningen. Leverandørmarkedet kommer til å pakke dette inn som produktivitet, kvalitet og sikkerhet. Innkjøpere bør stille tørrere spørsmål: Hvor ligger modellen? Hva skjer med dataene? Kan beslutninger revideres? Kan systemet settes i trygg modus? Hvordan testes sjeldne hendelser?

NVIDIA flytter konkurransen til fysisk infrastruktur

Lanseringen passer inn i NVIDIAs bredere strategi. Selskapet selger ikke bare brikker. Det bygger et helt løp fra treningsdata og modeller til simulering, skyinfrastruktur, edge-inferens og distribusjon. Med Cosmos 3 prøver NVIDIA å gjøre for fysisk AI det CUDA og GPU-stakken gjorde for akselerert databehandling: sette standarden utviklere og leverandører bygger rundt.

Det gjør saken strategisk. Hvis Cosmos får feste, kan mange robotikk- og vision-leverandører ende opp med samme underliggende modell- og deployeringslag. Det kan gi fart, men også leverandørkonsentrasjon. For større virksomheter blir spørsmålet ikke bare om teknologien virker, men om den gir låsing i en stack som etter hvert blir vanskelig å bytte ut.

Samtidig er det for tidlig å behandle dette som moden produksjonsteknologi for alle. NVIDIA bruker store ord, og flere deler av økosystemet vil være i ulike modenhetsfaser. Cosmos 3 Edge kommer først senere. Mange virksomheter vil møte teknologien gjennom partnere og leverandørprodukter lenge før de selv laster ned en modell.

Den praktiske anbefalingen er derfor ikke å kjøpe første beste robotdemo. Den er å oppdatere styringsmodellen for AI. Fysisk AI trenger egne krav før pilotene starter: risikoklassifisering, testregime, rollback, menneskelig overstyring, logging og tydelige grenser for hva systemet får gjøre autonomt.

Det som nå lanseres som verdensmodeller og robotferdigheter, kan om kort tid dukke opp i kameraer, fabrikkprogramvare, lagerroboter, inspeksjonsdroner og sikkerhetsløsninger. Da er det for sent å begynne med prinsippene.

Kilder og medier

Kilde: NVIDIA Newsroom – https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai

NVIDIA Newsroom er brukt som primærkilde for lansering, produktbeskrivelse, tilgjengelighet, modellvarianter, partnerøkosystem og sitater.

Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

AICIOCISO

Artificial Analysis: Claude Opus 5 tar ledelsen på agentbenchmark

Artificial Analysis plasserer Claude Opus 5 øverst på AA-Briefcase for agentisk kunnskapsarbeid. Viktigst for ledere: bedre analyse, men lange kjøretider og høy innsats gjør styring avgjørende.

26. juli 20265 min lesing

Artificial Analysis

Åpne saken

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken