CIO CISOStyreAI InfrastructureNVIDIAOpenAIAnthropicAI AgentsCloudVendor Risk

NVIDIA sender Vera til OpenAI og Anthropic: agentene får egen CPU

Joachim Høgby

18. mai 202618. mai 20265 min lesingKilde: NVIDIA

Del

LinkedIn X Facebook E-post WhatsApp Telegram

NVIDIA har sendt de første Vera CPU-systemene til noen av de mest sentrale aktørene i AI-kappløpet. Ifølge selskapet ble de første systemene levert til Anthropic i San Francisco, OpenAI i Mission Bay og SpaceXAI i Palo Alto fredag, før Oracle Cloud Infrastructure fikk sitt system mandag.

Det høres smalt ut. Det er det ikke. Vera er NVIDIAs første egendesignede CPU, bygget for agentisk AI. Poenget er enkelt: AI-agenter kjører ikke bare på GPU-er. De må starte sandkasser, gjøre verktøykall, hente kontekst, kjøre kode, styre arbeidsflyter og holde tilstand over tid. Mye av dette er CPU-arbeid.

Når de største modellmiljøene får maskinvaren først, er det et signal om hvor AI-infrastrukturen beveger seg. Kapasitetskampen handler ikke lenger bare om hvem som får nok H100, Blackwell eller Rubin. Den handler om hele systemet som skal få agenter fra demo til produksjon.

NVIDIA oppgir at Vera har 88 egendesignede Olympus-kjerner, 1,2 TB/s minnebåndbredde og 50 prosent raskere ytelse per kjerne under full last. CPU-en skal brukes både som frittstående system og som vertprosessor i Vera Rubin NVL72, der den kobles mot Rubin-GPU-er via andre generasjon NVLink-C2C. Selskapet sier Vera og Rubin deler minnearkitektur for å holde akselerert beregning bedre utnyttet.

For CIO-er og teknologiledere er dette den praktiske delen: agentkost blir ikke bare pris per token. Den blir pris per arbeidsflyt. Hver sandbox, hver testkjøring, hvert kall mot et internt API, hver filanalyse og hvert forsøk på å holde en lang kontekst i live bruker infrastruktur rundt modellen. Det er der CPU, minne, nettverk, logging og orkestrering avgjør om agenten blir rask, dyr, treg eller farlig.

Fra modellvalg til systemvalg

NVIDIA fremstiller Vera som et nytt CPU-øyeblikk for AI-fabrikken. Ian Buck, NVIDIAs leder for hyperscale og høyytelsesdatabehandling, sier i blogginnlegget at agentisk AI skaper et nytt behov fordi modeller går fra å svare til å handle.

Det er en presis formulering, også for norske virksomheter. Mange AI-strategier er fortsatt skrevet som om hovedvalget er modellnavn: GPT, Claude, Gemini, Llama, Mistral eller DeepSeek. Den fasen er for enkel. Når agentene får lov til å gjøre noe, må virksomheten velge system: hvor koden kjøres, hvilke verktøy agenten får bruke, hvor loggene havner, hvordan nøkler og rettigheter isoleres, og hvem som betaler når et agentløp går i ring.

Vera peker rett inn i den diskusjonen. NVIDIA sier CPU-en skal håndtere orkestrering, tool-calling, reinforcement learning-arbeidslaster, dataanalyse, agent-sandboxing og long-context state management. Det er ikke pynt rundt modellen. Det er kontrollflaten for AI i drift.

Anthropic-sitatet i NVIDIA-innlegget er nøkternt. James Bradbury, selskapets compute-sjef, sier at skalering av beregning er en viktig akselerator for modellvekst, og at Vera kan bli en del av økosystemet for agentiske arbeidslaster. OpenAI nevnes gjennom en levering til selskapets compute-infrastrukturleder Sachin Katti. SpaceXAI skal evaluere Vera for reinforcement learning og agentbaserte simuleringsløp.

Oracle-delen er kanskje mest relevant for vanlige bedriftskunder. OCI sier at de planlegger å ta i bruk hundretusener av NVIDIA Vera CPU-er fra 2026, fordi agentisk AI krever vedvarende ytelse i stor skala. Oracle omtales av NVIDIA som første skyleverandør som skal rulle ut Vera i hyperskala.

Det betyr at Vera ikke bare er en lab-brikke. Den er på vei inn i kommersiell skyinfrastruktur. Da flytter også beslutningen nærmere innkjøp, arkitektur og leverandørstyring.

Hva norske ledere bør lese ut av dette

Første punkt er kapasitet. Hvis AI-agenter skal gjøre reelt arbeid i utvikling, økonomi, kundeservice, sikkerhet eller analyse, trenger virksomheten kapasitet som tåler parallelle arbeidsløp. Det holder ikke å ha en modellavtale og et pent grensesnitt.

Andre punkt er avhengighet. Når OpenAI, Anthropic, SpaceXAI og Oracle får tidlig tilgang til ny NVIDIA-infrastruktur, blir leverandørkjeden enda tettere. Modellleverandør, chip-leverandør og skyleverandør formes i samme retning. For en norsk CIO betyr det at kontrakter må dekke mer enn modellpris. De må dekke kapasitet, flyttbarhet, datalokasjon, audit, nødutganger og hva som skjer når én del av stacken får knapphet eller prispress.

Tredje punkt er sikkerhet. Agentisk AI gjør CPU-laget mer sensitivt fordi det er der mye av handlingen skjer: kode kjører, filer åpnes, API-er kalles og verktøy får rettigheter. Hvis agentplattformen ikke har tydelige grenser for sandboxing, secrets, nettverkstilgang og logging, blir raskere infrastruktur også raskere feil.

Fjerde punkt er måling. Ledere bør slutte å spørre bare hvor god modellen er. De bør spørre hva en komplett agentarbeidsflyt koster, hvor ofte den feiler, hvor den stopper, hvor mye menneskelig kontroll som kreves, og hvilke deler av infrastrukturen som blir flaskehals. Vera-nyheten gjør det spørsmålet mer konkret.

Dette er grunnen til at saken fortjener hovedplass. NVIDIA leverer ikke bare en komponent. Selskapet viser at agentisk AI blir en egen driftsarkitektur. Når den arkitekturen først rulles ut hos OpenAI, Anthropic, SpaceXAI og Oracle, bør norske ledere lese det som et tidlig varsel: AI-budsjettet flytter seg fra eksperiment til produksjonsmaskin.

Kilder og medier

Primærkilde: NVIDIA Blog, «Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs», publisert 18. mai 2026. https://blogs.nvidia.com/blog/vera-cpu-delivery/
NVIDIA oppgir i artikkelen at Vera-systemer er levert til Anthropic, OpenAI, SpaceXAI og Oracle Cloud Infrastructure, og at OCI planlegger hundretusener av Vera CPU-er fra 2026.
Offisielt bilde/video fra NVIDIA-siden er brukt kun som kildekontekst. Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken

AI-modellerGoogle AIGemini

Google gjør Gemini Flash raskere for agentarbeid

Google lanserer Gemini 3.6 Flash og 3.5 Flash-Lite med tydeligere fokus på hastighet, token-effektivitet og produksjonsklare AI-agenter.

24. juli 20264 min lesing

Google AI

Åpne saken