Hopp til hovedinnhold
 AI-nyheter, ferdig filtrert for ledere
SISTE:

Anthropic tar første steg mot børs • Nettleserutvidelser blir hull i AI-chatten • Florida gjør ChatGPT-sikkerhet til rettssak • MiniMax presser åpne modeller inn i agentløpet • EU får innsyn i Anthropics cybermodell

NVIDIA åpner modellkrigen for fysisk AI
Breaking
CIOCISOCTOCFOStyreNVIDIACosmos 3Physical AIRoboticsAutonomous VehiclesVision AIWorld ModelsSynthetic DataEdge AIAI GovernanceAI SecurityOT SecurityLeverandørstyringRisikostyringEnterprise AI

NVIDIA åpner modellkrigen for fysisk AI

JH
Joachim Høgby
1. juni 20261. juni 20264 min lesingKilde: NVIDIA Newsroom

NVIDIA har lansert Cosmos 3, en åpen grunnmodell for fysisk AI. Modellen er laget for roboter, autonome kjøretøy og vision-agenter som må forstå, simulere og handle i den fysiske verden.

Dette er ikke en vanlig modellnyhet for tekst og kontorarbeid. NVIDIA prøver å eie neste lag i AI-stakken: systemene som trener, tester og styrer maskiner som beveger seg, ser og påvirker fysiske miljøer.

Ifølge NVIDIA bygger Cosmos 3 på en såkalt mixture-of-transformers-arkitektur. Den kombinerer resonnering, verdenssimulering og handlingsprediksjon i samme system. Selskapet beskriver modellen som en fullt åpen “omnimodel” som kan forstå og generere tekst, bilder, video, lyd og handlinger. Målet er å korte ned utviklingsløp for fysisk AI fra måneder til dager ved å bruke syntetiske data, simulering og forhåndstrente modeller.

For norske ledere er poenget enkelt: AI-agenter er på vei ut av chatvinduet. Neste bølge handler om kameraer, roboter, lager, industri, bygg, transport og sikkerhetssystemer. Da holder det ikke å diskutere prompt-policy og lisenskostnader. Virksomheter må vite hvem som har ansvar når en modell påvirker en produksjonslinje, en logistikkflyt eller et fysisk sikkerhetsmiljø.

Hva NVIDIA faktisk lanserer

Cosmos 3 kommer i flere varianter. Cosmos 3 Super er rettet mot robotikk og autonome kjøretøy som trenger høy fysikkpresisjon og genereringskvalitet. Cosmos 3 Nano skal gi raskere video- og handlingsresonnering. Cosmos 3 Edge er varslet for sanntids inferens ute på kanten, men er ikke tilgjengelig ennå.

NVIDIA sier modellen kan brukes som tre ting: en vision-language-modell som forstår flere modaliteter, en verdensmodell som simulerer miljøer og fremtidige tilstander, og en ryggrad for world action-modeller som trener roboter til konkrete oppgaver.

Det er særlig viktig for bransjer med dyre, farlige eller trege testmiljøer. En robot på fabrikkgulvet kan ikke feile i stor skala mens den lærer. Et autonomt kjøretøy kan ikke testes bare i snille demonstrasjoner. Et overvåkingssystem i et sykehus, en havn eller et datasenter må tåle avvik, rot og dårlige data. Verdensmodeller skal gjøre mer av denne testingen mulig før systemene slippes inn i virkeligheten.

NVIDIA peker også på nye datasett for robotikk, fysikk, menneskelig bevegelse, autonom kjøring, lagertrygghet og romlig resonnering. I tillegg kobles Cosmos-plattformen til fysiske AI-agentferdigheter for blant annet neural scene reconstruction, defektbilde-generering og videoaugmentering.

Det høres teknisk ut, men konsekvensen er praktisk: leverandører får ferdige byggesteiner for å lage AI-systemer som ser avvik, simulerer mulige hendelser og foreslår eller utfører handlinger.

Åpen modell, lukket styringsproblem

NVIDIA markedsfører Cosmos 3 som åpen. Modellene skal kunne prøves på build.nvidia.com, lastes ned fra Hugging Face, tilpasses med Diffusers og ressurser på GitHub, og kjøres som NVIDIA NIM-mikrotjenester. Selskapet lanserer også Cosmos Coalition med blant andre Agile Robots, Black Forest Labs, Generalist, LTX, Runway og Skild AI.

Åpenhet betyr likevel ikke enkel styring. Når modeller kan lastes ned, tilpasses og kjøres på tvers av skyløsninger, edge-noder og leverandørmiljøer, blir kontrollspørsmålene mer krevende. Hvilken modellversjon ble brukt? Hvilke syntetiske data ble generert? Hvem godkjente endringen? Hva skjer når modellen fungerer i simulering, men ikke i et vått lager, et støvete verksted eller en travel havneterminal?

Dette er en CIO- og CISO-sak, ikke bare en robotikknyhet. Fysisk AI vil kreve nye krav til logging, endringskontroll, rolle- og tilgangsstyring, testbevis og beredskap. For styret handler det om ansvar og risikotoleranse. For CFO handler det om hvor raskt automatiseringsgevinster kan tas ut uten å bygge skjult operasjonell risiko.

Norske virksomheter som allerede bruker kameraanalyse, autonome inspeksjoner, lagerautomatisering eller digitale tvillinger bør merke seg retningen. Leverandørmarkedet kommer til å pakke dette inn som produktivitet, kvalitet og sikkerhet. Innkjøpere bør stille tørrere spørsmål: Hvor ligger modellen? Hva skjer med dataene? Kan beslutninger revideres? Kan systemet settes i trygg modus? Hvordan testes sjeldne hendelser?

NVIDIA flytter konkurransen til fysisk infrastruktur

Lanseringen passer inn i NVIDIAs bredere strategi. Selskapet selger ikke bare brikker. Det bygger et helt løp fra treningsdata og modeller til simulering, skyinfrastruktur, edge-inferens og distribusjon. Med Cosmos 3 prøver NVIDIA å gjøre for fysisk AI det CUDA og GPU-stakken gjorde for akselerert databehandling: sette standarden utviklere og leverandører bygger rundt.

Det gjør saken strategisk. Hvis Cosmos får feste, kan mange robotikk- og vision-leverandører ende opp med samme underliggende modell- og deployeringslag. Det kan gi fart, men også leverandørkonsentrasjon. For større virksomheter blir spørsmålet ikke bare om teknologien virker, men om den gir låsing i en stack som etter hvert blir vanskelig å bytte ut.

Samtidig er det for tidlig å behandle dette som moden produksjonsteknologi for alle. NVIDIA bruker store ord, og flere deler av økosystemet vil være i ulike modenhetsfaser. Cosmos 3 Edge kommer først senere. Mange virksomheter vil møte teknologien gjennom partnere og leverandørprodukter lenge før de selv laster ned en modell.

Den praktiske anbefalingen er derfor ikke å kjøpe første beste robotdemo. Den er å oppdatere styringsmodellen for AI. Fysisk AI trenger egne krav før pilotene starter: risikoklassifisering, testregime, rollback, menneskelig overstyring, logging og tydelige grenser for hva systemet får gjøre autonomt.

Det som nå lanseres som verdensmodeller og robotferdigheter, kan om kort tid dukke opp i kameraer, fabrikkprogramvare, lagerroboter, inspeksjonsdroner og sikkerhetsløsninger. Da er det for sent å begynne med prinsippene.

Kilder og medier

Kilde: NVIDIA Newsroom – https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai

NVIDIA Newsroom er brukt som primærkilde for lansering, produktbeskrivelse, tilgjengelighet, modellvarianter, partnerøkosystem og sitater.

Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.