Alibaba lanserer Zhenwu M890: Kina bygger AI-brikker for agentene

Breaking

CIO CFO CISOStyreAlibabaAI InfrastructureAI ChipsAI AgentsChinaVendor RiskAI Governance

Alibaba lanserer Zhenwu M890: Kina bygger AI-brikker for agentene

Joachim Høgby

20. mai 202620. mai 20265 min lesingKilde: Reuters

Del

LinkedIn X Facebook E-post WhatsApp Telegram

BEIJING/SINGAPORE: Alibaba gjør AI-brikker til et styringsspørsmål, ikke bare et datasenter-spørsmål.

Selskapet lanserte onsdag Zhenwu M890, en ny AI-prosessor fra brikkeselskapet T-Head. Ifølge Reuters sier Alibaba at brikken leverer tre ganger ytelsen til forrige generasjon, Zhenwu 810E, og er laget for agentiske arbeidslaster: systemer som holder lang kontekst, koordinerer flere modeller og utfører oppgaver over tid med mindre menneskelig styring.

Det er den delen norske ledere bør merke seg. AI-infrastruktur bygges nå rundt en annen type bruk enn tradisjonell chatbot-trafikk. Når agenter skal kode, analysere, hente data, bruke verktøy og jobbe i lange kjeder, blir minne, nettverk og kommunikasjon mellom akseleratorer like viktig som rå regnekraft.

Alibaba plasserer M890 rett inn i den kampen. Selskapet sier også at det har en flerårig brikkeplan: V900 i tredje kvartal 2027, og J900 i tredje kvartal 2028. V900 skal, ifølge Alibaba, gi omtrent tre ganger ytelsen til M890. Dette er ikke en engangslansering. Det er et forsøk på å bygge en kinesisk rytme for AI-silisium.

Bakgrunnen er brutal og enkel: USA strammer inn eksporten av de kraftigste Nvidia-prosessorene til kinesiske kunder. Kina svarer med egne brikker, egne modellplattformer og egne serverarkitekturer. Huawei har allerede tatt mye av rollen som nasjonal Nvidia-erstatter. Nå forsøker Alibaba å flytte samme logikk inn i egen sky, egne modeller og egne bedriftskunder.

Hva Alibaba faktisk lanserte

Reuters skriver at M890 ble vist frem på Alibaba Cloud Summit. Brikken er utviklet av T-Head og skal være tilpasset tunge krav til minne og kommunikasjon i agentarbeidslaster. Alibaba lanserte samtidig Panjiu AL128, et serversystem som pakker 128 akseleratorer i én rack-løsning.

Systemet er tilgjengelig for kinesiske bedriftskunder gjennom Alibaba Clouds innenlandske modellplattform Bailian. Det er viktig: dette handler ikke bare om laboratorieytelse. Alibaba forsøker å knytte brikke, server, skyplattform og modellbruk sammen i én kommersiell pakke.

T-Head oppgir at det har sendt mer enn 560.000 Zhenwu-enheter så langt, og at over 400 eksterne kunder i 20 bransjer har tatt brikkene i bruk. Reuters nevner blant annet bilindustri og finans. Tallene er Alibaba-tall, ikke uavhengige benchmarktester, men de sier noe om ambisjonsnivået: dette skal inn i produksjon, ikke stå på en messevegg.

Alibaba koblet også lanseringen til Qwen 3.7-Max, nyeste versjon av selskapets store språkmodell. Selskapet sier modellen er laget for avansert koding og langvarige agentoppgaver, og kan kjøre kontinuerlig i opptil 35 timer uten ytelsesfall. Den påstanden bør leses nøkternt til uavhengige tester finnes. Men retningen er klar: modell, agent og brikke optimaliseres sammen.

Hvorfor dette betyr noe utenfor Kina

For norske virksomheter er ikke hovedspørsmålet om Alibaba Cloud skal bli førstevalg i morgen. For mange vil svaret være nei, av regulatoriske, sikkerhetsmessige og geopolitiske grunner. Poenget er større: AI-markedet deles raskere opp i regionale teknologistakker.

I den ene enden ligger Nvidia, OpenAI, Microsoft, Google, AWS og vestlige skyplattformer. I den andre bygger kinesiske aktører mer integrerte pakker med egne modeller, egne brikker og egne skyer. Mellom dem ligger europeiske virksomheter som må kjøpe kapasitet, sikre data, unngå låsing og likevel få fart på agentprosjektene.

Dette endrer innkjøp. En CIO kan ikke lenger vurdere AI-plattform som programvare alene. Spørsmålene blir mer fysiske: Hvilke akseleratorer er plattformen optimalisert for? Hvor ligger kapasiteten? Hva skjer hvis eksportregler, leverandørprioritering eller geopolitikk flytter pris og tilgjengelighet? Kan arbeidslasten flyttes, eller er den bundet til én modell, ett API, én sky og én brikketype?

Det er også et CFO-spørsmål. Alibaba sa i fjor at selskapet vil bruke mer enn 380 milliarder yuan, rundt 53 milliarder dollar, på sky- og AI-infrastruktur over tre år. Den typen kapitalbruk viser hvor dyrt agentkappløpet blir. Når leverandørene binder modeller tettere til egen maskinvare, blir prisingen mindre gjennomsiktig. Rabatt i API-et kan betales gjennom låsing i infrastrukturen.

Agentene gjør brikkevalg strategisk

Tradisjonell AI-debatt har handlet mye om modellkvalitet. Hvilken modell scorer best? Hvilken er billigst per token? Hvilken skriver best kode? Agentiske systemer flytter noe av konkurransen nedover i stakken.

En agent som jobber i timer, ikke sekunder, belaster infrastrukturen annerledes. Den trenger lange kontekstvinduer, verktøykall, minne, raske dataflytter og stabil kjøring. Den kan bruke flere modeller samtidig. Den kan også skape uforutsigbar etterspørsel: en enkel brukerforespørsel kan bli til hundrevis av operasjoner bak scenen.

Derfor er M890 interessant selv om Alibaba ikke har bevist alt offentlig. Den viser at brikkeprodusentene nå designer eksplisitt for agentmønstre. Det samme ser vi i vestlige datasenterhistorier: compute selges som knapp kapasitet, nye CPU/GPU-koblinger bygges for agenttrafikk, og skyaktører lager egne kontrollplan for verktøy, logging og godkjenning.

For styret betyr det at AI-risiko ikke bare handler om hallusinasjoner og datalekkasjer. Den handler også om kapasitetstilgang, leverandørmakt og hvor raskt konkurrenter i andre regioner kan industrialisere AI-arbeidsflyter.

Hva norske ledere bør gjøre nå

Første tiltak er å kartlegge hvor agentprosjektene faktisk kjører. Ikke bare leverandørnavn, men modell, skyregion, akseleratoravhengighet, datakilder, verktøytilganger og exit-mulighet. Hvis arbeidsflyten bare fungerer i én leverandørs fulle stakk, bør det være et bevisst valg, ikke en teknisk tilfeldighet.

Andre tiltak er å stramme inn kontraktene. Spør etter kapasitet, prisbeskyttelse, datalagring, modellendringer, logging, revisjon og hva som skjer ved eksportkontroller eller leverandørbegrensninger. Dette er særlig viktig for finans, industri, energi, offentlig sektor og selskaper som jobber på tvers av USA, Europa og Asia.

Tredje tiltak er å skille mellom pilot og produksjon. En agentdemo kan være billig og enkel. En produksjonsagent som kjører lenge, bruker verktøy og berører penger, kunder eller kritisk drift, er en infrastrukturbeslutning. Den trenger budsjett, arkitektur og styring som et driftskritisk system.

Alibaba-lanseringen er ikke en norsk anskaffelsesanbefaling. Den er et varsel om hvor AI-markedet går: mot mer vertikale pakker, mer regional teknologi og mer fysisk knapphet. Ledere som behandler AI som «bare software», kommer til å forhandle for sent.

Kilder og medier

Primærkilde: Reuters, «Alibaba unveils new AI chip in push for domestic alternatives», publisert 20. mai 2026: https://www.reuters.com/world/asia-pacific/alibaba-unveils-new-ai-chip-push-domestic-alternatives-2026-05-20/
Reuters-kreditering: saken bygger på Reuters' rapportering fra Beijing/Singapore, inkludert Alibaba-opplysninger om Zhenwu M890, Panjiu AL128, T-Head-volumer, Qwen 3.7-Max og selskapets flerårige brikkeplan.
Bakgrunn: Alibaba Cloud Community, «In-depth Analysis of Alibaba Cloud Panjiu AL128 Supernode AI Servers and Their Interconnect Architecture», 14. november 2025: https://www.alibabacloud.com/blog/in-depth-analysis-of-alibaba-cloud-panjiu-al128-supernode-ai-servers-and-their-interconnect-architecture_602665
Bildebruk: Reuters' nyhetsfoto er ikke rehostet. Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken

AI-modellerGoogle AIGemini

Google gjør Gemini Flash raskere for agentarbeid

Google lanserer Gemini 3.6 Flash og 3.5 Flash-Lite med tydeligere fokus på hastighet, token-effektivitet og produksjonsklare AI-agenter.

24. juli 20264 min lesing

Google AI

Åpne saken