Hopp til hovedinnhold
 AI-nyheter, ferdig filtrert for ledere
SISTE:

Anthropic tar første steg mot børs • Nettleserutvidelser blir hull i AI-chatten • Florida gjør ChatGPT-sikkerhet til rettssak • MiniMax presser åpne modeller inn i agentløpet • EU får innsyn i Anthropics cybermodell

MiniMax presser åpne modeller inn i agentløpet
Breaking
CIOCISOCTOStyreMiniMaxMiniMax M3Open-weight AIAI AgentsCoding AgentsAgent GovernanceFoundation ModelsMultimodal AILong ContextModel GovernanceAI SecurityKinaLeverandørstyringRisikostyringEnterprise AI

MiniMax presser åpne modeller inn i agentløpet

JH
Joachim Høgby
1. juni 20261. juni 20265 min lesingKilde: MiniMax Research

Hva har skjedd?

MiniMax lanserer M3, en ny modellfamilie rettet mot koding, agentiske arbeidsflyter og multimodale oppgaver. Selskapet beskriver M3 som en modell som samler tre egenskaper som til nå i hovedsak har ligget hos lukkede frontier-modeller: høy ytelse på kodeoppgaver, lang kontekst og multimodal input.

Den konkrete påstanden er tung nok til å merke seg. MiniMax sier M3 støtter opptil én million tokens kontekst via MiniMax Sparse Attention, og at modellen kan håndtere både bilde- og videoinput. Selskapet hevder også at modellen kan operere en desktop-maskin, altså bevege seg nærmere den typen agentbruk der modellen ikke bare svarer, men utfører arbeid i verktøy og grensesnitt.

På benchmarks oppgir MiniMax 59,0 prosent på SWE-Bench Pro, 66,0 prosent på Terminal-Bench 2.1, 34,8 prosent på SWE-fficiency, 28,8 prosent på KernelBench Hard og 74,2 prosent på MCP Atlas. Selskapet skriver at M3 passerer GPT-5.5 og Gemini 3.1 Pro på SWE-Bench Pro, og nærmer seg Claude Opus 4.7. Det er MiniMax sine egne tall, ikke uavhengig tredjepartsverifisering. De bør derfor leses som leverandørdata, ikke som fasit.

M3 er tilgjengelig gjennom MiniMax Code, Token Plan og selskapets API. Det viktigste for virksomheter som følger åpne modellstrategier er likevel at MiniMax sier at teknisk rapport og tilhørende modellvekter skal slippes som open source i løpet av de neste ti dagene.

Hvorfor det betyr noe

Dette er ikke bare enda en modellmelding. M3 peker på tre bevegelser som treffer norske teknologiledere direkte.

For det første flytter open-weight-modeller seg inn i oppgaver som tidligere var forbeholdt de dyreste lukkede modellene. Koding, terminalarbeid og langvarige agentøkter er nettopp der virksomheter nå tester om AI kan gi mer enn chat og dokumenthjelp. Hvis en åpen modell faktisk kan levere godt nok på slike oppgaver, endrer det regnestykket for kost, dataflyt og leverandørvalg.

For det andre gjør lang kontekst agentstyring mer krevende. Én million tokens kan gi bedre arbeid over store kodebaser, loggdata og dokumentpakker. Det kan også gjøre feil vanskeligere å oppdage. Når agenten bærer mer historikk, mer kode og flere beslutninger inn i samme økt, må logging, tilgangsstyring og kildekontroll være på plass før modellen får skrive i produksjonsnære miljøer.

For det tredje kommer geopolitikken inn bakveien. MiniMax er en kinesisk aktør. For norske virksomheter betyr det ikke automatisk nei, men det betyr at vurderingen må være skarpere enn en vanlig modelltest. Databehandleransvar, jurisdiksjon, eksportkontroll, sanksjonsrisiko, logging, modellvekter og hvor inferens faktisk kjøres må inn i anskaffelsen. Det gjelder særlig i finans, energi, helse, forsvarsnære miljøer og offentlig sektor.

Hva CIO og CISO bør gjøre nå

Den riktige reaksjonen er ikke å bytte modell over natten. Den er å forberede en praktisk testløype.

Start med å skille mellom tre bruksmønstre: API-bruk hos MiniMax, bruk via MiniMax Code og eventuell lokal kjøring når vektene faktisk blir publisert. Risikoen er forskjellig i hvert spor. API-sporet handler om dataflyt og leverandøravtale. Kodeagent-sporet handler om tilgang til repoer, terminal og hemmeligheter. Lokal kjøring handler om modellstyring, patching, observability og hvem som eier inference-miljøet.

Deretter bør modellen testes på egne, ufarlige arbeidsoppgaver. Ikke spør om den kan skrive en demoapp. Mål den på faktiske refaktoreringer, feilsøkingsløp, testforbedringer og dokumentasjon i interne repoer uten sensitive data. Sammenlign mot dagens standardmodell, og mål tid spart, feilrate, testdekning og hvor mye menneskelig kontroll som trengs.

CISO bør samtidig behandle koding med agent som en privilegert operasjon. Agenten bør ikke ha bred terminaltilgang, hemmeligheter i miljøvariabler eller fri push-rett til repoer. Bruk kortlevde credentials, sandkasser, policy for verktøybruk og tydelig revisjonsspor. Hvis modellen skal lese store kontekster, må man vite hvilke data som faktisk går inn.

Den nøkterne vurderingen

MiniMax M3 kan bli viktig hvis vektene slippes som lovet og uavhengige tester bekrefter deler av ytelsen. Da får markedet en ny åpen modell som konkurrerer på områder der virksomheter faktisk bruker penger: kode, agenter, lange arbeidsøkter og multimodal analyse.

Men det er for tidlig å behandle M3 som et etablert enterprise-valg. Teknisk rapport mangler fortsatt. Vektene er varslet, ikke publisert. Benchmarkene er leverandørdata. Tilgjengelighet, lisensvilkår og praktisk drift må kontrolleres før modellen får plass i en styrt portefølje.

Likevel er signalet klart. Åpne modeller er ikke lenger bare et kostnadsalternativ for enklere tekstoppgaver. De prøver nå å ta posisjon i selve agentlaget. Det er der både gevinsten og risikoen ligger.

Kilder og medier

Primærkilde: MiniMax Research – https://www.minimax.io/blog/minimax-m3

MiniMax oppgir selv benchmarktall, arkitekturpåstander, API-tilgjengelighet og planlagt publisering av teknisk rapport og modellvekter. hogby.ai har behandlet tallene som leverandørpåstander, ikke uavhengig verifiserte resultater.

Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.