CIO CFO CISOCTOStyreByteDanceTikTokAI InfrastructureCPUInferensAI AgentsBrikkerLeverandørstyringFinOpsCloud StrategyKinaEnterprise AIAI Governance

ByteDance bygger egne CPU-er for AI-inferens

Joachim Høgby

29. mai 202629. mai 20264 min lesingKilde: Reuters

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Reuters melder at ByteDance utvikler egne sentralprosessorer for AI-infrastrukturen sin. Ifølge tre personer med kjennskap til arbeidet skal TikTok-eieren bygge CPU-er som kan støtte den voksende bruken av AI-modeller i produksjon, samtidig som høye priser og knapp tilgang på brikker gjør ekspansjonen dyrere.

Det høres smalere ut enn nok en GPU-nyhet. Det er det ikke. CPU-laget er i ferd med å bli en viktigere del av AI-regningen. Trening av store modeller har gitt Nvidia-GPU-er hovedrollen de siste årene. Nå flyttes mer av konkurransen over i inferens: den daglige kjøringen av modellene når de svarer brukere, henter data, kaller verktøy, analyserer video, skriver kode eller styrer agentløp.

I slike systemer jobber CPU-er og GPU-er tett sammen. GPU-ene gjør den tunge modellregningen. CPU-ene håndterer orkestrering, minneflyt, nettverk, sikkerhetskontroller, datatilgang og store mengder små beslutninger rundt hvert kall. Når agentiske systemer går fra demo til drift, øker trykket på hele serverarkitekturen, ikke bare på akseleratorene.

For ByteDance er dette både et teknologivalg og et leverandørgrep. Selskapet driver noen av verdens mest trafikkerte forbrukerplattformer, men bygger også stadig mer AI inn i anbefaling, søk, annonseprodukter, innholdsverktøy og interne utviklingsløp. Hvis Reuters-bildet stemmer, vil ByteDance redusere avhengigheten av standard serverbrikker i et marked der kapasitet, pris og eksportregler har blitt strategiske risikofaktorer.

Hvorfor CPU-en er tilbake i AI-samtalen

AI-infrastruktur har lenge blitt omtalt som et GPU-problem. Det er for enkelt. I produksjonsmiljøer er flaskehalsen ofte summen av modell, datarør, identitet, logging, køer, nettverk, minne, policy og koststyring. Jo mer autonom en AI-agent blir, desto flere systemkall og kontrollpunkter må kjøres rundt selve modellen.

Det gjør CPU-kapasiteten mer synlig. En chatbot som svarer på ett spørsmål er én type last. En agent som henter dokumenter, sjekker rettigheter, skriver forslag, kaller API-er, evaluerer egne svar og logger hvert steg for revisjon, er noe annet. Da blir generisk serverkapasitet en del av modelløkonomien.

Reuters skriver at utviklingen viser hvordan bransjen flytter mer vekt mot inferens. Det er viktig for norske virksomheter også. De fleste kommer ikke til å trene frontiermodeller. De kommer til å kjøpe tilgang til modeller, kjøre dem i egne sky- eller hybridmiljøer, koble dem til fagsystemer og betale for bruk. Da blir pris per oppgave, ventetid og kapasitet viktigere enn modellnavnet på presentasjonssliden.

ByteDance følger hyperskalerne

ByteDance er ikke alene om å se på egne brikker som et økonomisk våpen. Google, Amazon og Microsoft har alle utviklet egne brikker for deler av AI- og skyinfrastrukturen. Motivet er ikke bare ytelse. Det handler om å kontrollere kostkurven, forhandle bedre med leverandører og bygge arkitektur som passer egne arbeidslaster.

Det samme mønsteret sprer seg nå til selskaper med stor AI-trafikk, men uten klassisk hyperskalerprofil. ByteDance er et godt eksempel. Selskapet har global skala, ekstrem datamengde og et produktmiljø der små endringer i anbefaling, annonser og generativ funksjonalitet kan gi store utslag. Da blir brikkeøkonomi et konsernspørsmål.

For CIO-er og CFO-er er signalet klart: AI-kostnaden flytter seg nedover i stacken. Modellvalg er fortsatt viktig, men infrastrukturen under blir mer spesialisert. Det kan gi lavere enhetskostnad for de største aktørene. Det kan også gi sterkere leverandørbinding for kundene som kjøper ferdige AI-tjenester fra dem.

Hva norske ledere bør ta med seg

Den første konsekvensen er at AI-priser ikke bør behandles som vanlige SaaS-priser. Kostnaden bak tjenestene endrer seg raskt. Leverandører som eier mer av stacken, kan presse prisene ned eller pakke kapasitet på nye måter. Leverandører som må kjøpe all kapasitet dyrt i markedet, kan bli mindre forutsigbare.

Den andre konsekvensen er risiko. Hvis AI-løsningen din bygger tungt på én plattform, arver du også plattformens infrastrukturvalg, geopolitisk eksponering og kapasitetsprioriteringer. Det gjelder enten leverandøren heter Microsoft, Google, Amazon, OpenAI, Anthropic, ByteDance eller noe mindre.

Den tredje konsekvensen er at innkjøp må bli mer teknisk. Spørsmålene bør ikke stoppe ved modellnavn, kontekstlengde og pris per million tokens. Virksomheter bør spørre hvordan leverandøren håndterer inferenskapasitet, regioner, kø, logging, dataflyt, failover og kostkontroll. For regulerte bransjer er også underleverandørkjeden relevant.

ByteDance-saken er derfor mer enn en Kina-notis. Den viser hvor AI-konkurransen går når modellene blir hverdagsteknologi. De største aktørene prøver å eie mer av verdikjeden fordi brikkemangel, energibruk og inferenskostnader avgjør marginene.

For norske virksomheter betyr det én ting: AI-strategi må kobles tettere til skystrategi, finops og leverandørstyring. Hvis agentene skal inn i kjerneprosesser, må infrastrukturen vurderes som kritisk produksjonskapasitet. Ikke som et eksperiment med pent grensesnitt.

Kilder og medier

Primærkilde: Reuters, «Exclusive: ByteDance developing custom CPU chips to support AI rollout, sources say», publisert 28. mai 2026. Source: https://www.reuters.com/world/china/bytedance-developing-custom-cpu-chips-support-ai-rollout-sources-say-2026-05-28

Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken

AI-modellerGoogle AIGemini

Google gjør Gemini Flash raskere for agentarbeid

Google lanserer Gemini 3.6 Flash og 3.5 Flash-Lite med tydeligere fokus på hastighet, token-effektivitet og produksjonsklare AI-agenter.

24. juli 20264 min lesing

Google AI

Åpne saken