Alibaba lanserer Zhenwu M890: Kina bygger AI-brikker for agentene
BEIJING/SINGAPORE: Alibaba gjør AI-brikker til et styringsspørsmål, ikke bare et datasenter-spørsmål.
Selskapet lanserte onsdag Zhenwu M890, en ny AI-prosessor fra brikkeselskapet T-Head. Ifølge Reuters sier Alibaba at brikken leverer tre ganger ytelsen til forrige generasjon, Zhenwu 810E, og er laget for agentiske arbeidslaster: systemer som holder lang kontekst, koordinerer flere modeller og utfører oppgaver over tid med mindre menneskelig styring.
Det er den delen norske ledere bør merke seg. AI-infrastruktur bygges nå rundt en annen type bruk enn tradisjonell chatbot-trafikk. Når agenter skal kode, analysere, hente data, bruke verktøy og jobbe i lange kjeder, blir minne, nettverk og kommunikasjon mellom akseleratorer like viktig som rå regnekraft.
Alibaba plasserer M890 rett inn i den kampen. Selskapet sier også at det har en flerårig brikkeplan: V900 i tredje kvartal 2027, og J900 i tredje kvartal 2028. V900 skal, ifølge Alibaba, gi omtrent tre ganger ytelsen til M890. Dette er ikke en engangslansering. Det er et forsøk på å bygge en kinesisk rytme for AI-silisium.
Bakgrunnen er brutal og enkel: USA strammer inn eksporten av de kraftigste Nvidia-prosessorene til kinesiske kunder. Kina svarer med egne brikker, egne modellplattformer og egne serverarkitekturer. Huawei har allerede tatt mye av rollen som nasjonal Nvidia-erstatter. Nå forsøker Alibaba å flytte samme logikk inn i egen sky, egne modeller og egne bedriftskunder.
Hva Alibaba faktisk lanserte
Reuters skriver at M890 ble vist frem på Alibaba Cloud Summit. Brikken er utviklet av T-Head og skal være tilpasset tunge krav til minne og kommunikasjon i agentarbeidslaster. Alibaba lanserte samtidig Panjiu AL128, et serversystem som pakker 128 akseleratorer i én rack-løsning.
Systemet er tilgjengelig for kinesiske bedriftskunder gjennom Alibaba Clouds innenlandske modellplattform Bailian. Det er viktig: dette handler ikke bare om laboratorieytelse. Alibaba forsøker å knytte brikke, server, skyplattform og modellbruk sammen i én kommersiell pakke.
T-Head oppgir at det har sendt mer enn 560.000 Zhenwu-enheter så langt, og at over 400 eksterne kunder i 20 bransjer har tatt brikkene i bruk. Reuters nevner blant annet bilindustri og finans. Tallene er Alibaba-tall, ikke uavhengige benchmarktester, men de sier noe om ambisjonsnivået: dette skal inn i produksjon, ikke stå på en messevegg.
Alibaba koblet også lanseringen til Qwen 3.7-Max, nyeste versjon av selskapets store språkmodell. Selskapet sier modellen er laget for avansert koding og langvarige agentoppgaver, og kan kjøre kontinuerlig i opptil 35 timer uten ytelsesfall. Den påstanden bør leses nøkternt til uavhengige tester finnes. Men retningen er klar: modell, agent og brikke optimaliseres sammen.
Hvorfor dette betyr noe utenfor Kina
For norske virksomheter er ikke hovedspørsmålet om Alibaba Cloud skal bli førstevalg i morgen. For mange vil svaret være nei, av regulatoriske, sikkerhetsmessige og geopolitiske grunner. Poenget er større: AI-markedet deles raskere opp i regionale teknologistakker.
I den ene enden ligger Nvidia, OpenAI, Microsoft, Google, AWS og vestlige skyplattformer. I den andre bygger kinesiske aktører mer integrerte pakker med egne modeller, egne brikker og egne skyer. Mellom dem ligger europeiske virksomheter som må kjøpe kapasitet, sikre data, unngå låsing og likevel få fart på agentprosjektene.
Dette endrer innkjøp. En CIO kan ikke lenger vurdere AI-plattform som programvare alene. Spørsmålene blir mer fysiske: Hvilke akseleratorer er plattformen optimalisert for? Hvor ligger kapasiteten? Hva skjer hvis eksportregler, leverandørprioritering eller geopolitikk flytter pris og tilgjengelighet? Kan arbeidslasten flyttes, eller er den bundet til én modell, ett API, én sky og én brikketype?
Det er også et CFO-spørsmål. Alibaba sa i fjor at selskapet vil bruke mer enn 380 milliarder yuan, rundt 53 milliarder dollar, på sky- og AI-infrastruktur over tre år. Den typen kapitalbruk viser hvor dyrt agentkappløpet blir. Når leverandørene binder modeller tettere til egen maskinvare, blir prisingen mindre gjennomsiktig. Rabatt i API-et kan betales gjennom låsing i infrastrukturen.
Agentene gjør brikkevalg strategisk
Tradisjonell AI-debatt har handlet mye om modellkvalitet. Hvilken modell scorer best? Hvilken er billigst per token? Hvilken skriver best kode? Agentiske systemer flytter noe av konkurransen nedover i stakken.
En agent som jobber i timer, ikke sekunder, belaster infrastrukturen annerledes. Den trenger lange kontekstvinduer, verktøykall, minne, raske dataflytter og stabil kjøring. Den kan bruke flere modeller samtidig. Den kan også skape uforutsigbar etterspørsel: en enkel brukerforespørsel kan bli til hundrevis av operasjoner bak scenen.
Derfor er M890 interessant selv om Alibaba ikke har bevist alt offentlig. Den viser at brikkeprodusentene nå designer eksplisitt for agentmønstre. Det samme ser vi i vestlige datasenterhistorier: compute selges som knapp kapasitet, nye CPU/GPU-koblinger bygges for agenttrafikk, og skyaktører lager egne kontrollplan for verktøy, logging og godkjenning.
For styret betyr det at AI-risiko ikke bare handler om hallusinasjoner og datalekkasjer. Den handler også om kapasitetstilgang, leverandørmakt og hvor raskt konkurrenter i andre regioner kan industrialisere AI-arbeidsflyter.
Hva norske ledere bør gjøre nå
Første tiltak er å kartlegge hvor agentprosjektene faktisk kjører. Ikke bare leverandørnavn, men modell, skyregion, akseleratoravhengighet, datakilder, verktøytilganger og exit-mulighet. Hvis arbeidsflyten bare fungerer i én leverandørs fulle stakk, bør det være et bevisst valg, ikke en teknisk tilfeldighet.
Andre tiltak er å stramme inn kontraktene. Spør etter kapasitet, prisbeskyttelse, datalagring, modellendringer, logging, revisjon og hva som skjer ved eksportkontroller eller leverandørbegrensninger. Dette er særlig viktig for finans, industri, energi, offentlig sektor og selskaper som jobber på tvers av USA, Europa og Asia.
Tredje tiltak er å skille mellom pilot og produksjon. En agentdemo kan være billig og enkel. En produksjonsagent som kjører lenge, bruker verktøy og berører penger, kunder eller kritisk drift, er en infrastrukturbeslutning. Den trenger budsjett, arkitektur og styring som et driftskritisk system.
Alibaba-lanseringen er ikke en norsk anskaffelsesanbefaling. Den er et varsel om hvor AI-markedet går: mot mer vertikale pakker, mer regional teknologi og mer fysisk knapphet. Ledere som behandler AI som «bare software», kommer til å forhandle for sent.
Kilder og medier
- Primærkilde: Reuters, «Alibaba unveils new AI chip in push for domestic alternatives», publisert 20. mai 2026: https://www.reuters.com/world/asia-pacific/alibaba-unveils-new-ai-chip-push-domestic-alternatives-2026-05-20/
- Reuters-kreditering: saken bygger på Reuters' rapportering fra Beijing/Singapore, inkludert Alibaba-opplysninger om Zhenwu M890, Panjiu AL128, T-Head-volumer, Qwen 3.7-Max og selskapets flerårige brikkeplan.
- Bakgrunn: Alibaba Cloud Community, «In-depth Analysis of Alibaba Cloud Panjiu AL128 Supernode AI Servers and Their Interconnect Architecture», 14. november 2025: https://www.alibabacloud.com/blog/in-depth-analysis-of-alibaba-cloud-panjiu-al128-supernode-ai-servers-and-their-interconnect-architecture_602665
- Bildebruk: Reuters' nyhetsfoto er ikke rehostet. Thumbnail: OpenAI Image 2 / hogby.ai.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.