MiniMax presser åpne modeller inn i agentløpet

Breaking

CIO CISOCTOStyreMiniMaxMiniMax M3Open-weight AIAI AgentsCoding AgentsAgent GovernanceFoundation ModelsMultimodal AILong ContextModel GovernanceAI SecurityKinaLeverandørstyringRisikostyringEnterprise AI

MiniMax presser åpne modeller inn i agentløpet

Joachim Høgby

1. juni 20261. juni 20265 min lesingKilde: MiniMax Research

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Hva har skjedd?

MiniMax lanserer M3, en ny modellfamilie rettet mot koding, agentiske arbeidsflyter og multimodale oppgaver. Selskapet beskriver M3 som en modell som samler tre egenskaper som til nå i hovedsak har ligget hos lukkede frontier-modeller: høy ytelse på kodeoppgaver, lang kontekst og multimodal input.

Den konkrete påstanden er tung nok til å merke seg. MiniMax sier M3 støtter opptil én million tokens kontekst via MiniMax Sparse Attention, og at modellen kan håndtere både bilde- og videoinput. Selskapet hevder også at modellen kan operere en desktop-maskin, altså bevege seg nærmere den typen agentbruk der modellen ikke bare svarer, men utfører arbeid i verktøy og grensesnitt.

På benchmarks oppgir MiniMax 59,0 prosent på SWE-Bench Pro, 66,0 prosent på Terminal-Bench 2.1, 34,8 prosent på SWE-fficiency, 28,8 prosent på KernelBench Hard og 74,2 prosent på MCP Atlas. Selskapet skriver at M3 passerer GPT-5.5 og Gemini 3.1 Pro på SWE-Bench Pro, og nærmer seg Claude Opus 4.7. Det er MiniMax sine egne tall, ikke uavhengig tredjepartsverifisering. De bør derfor leses som leverandørdata, ikke som fasit.

M3 er tilgjengelig gjennom MiniMax Code, Token Plan og selskapets API. Det viktigste for virksomheter som følger åpne modellstrategier er likevel at MiniMax sier at teknisk rapport og tilhørende modellvekter skal slippes som open source i løpet av de neste ti dagene.

Hvorfor det betyr noe

Dette er ikke bare enda en modellmelding. M3 peker på tre bevegelser som treffer norske teknologiledere direkte.

For det første flytter open-weight-modeller seg inn i oppgaver som tidligere var forbeholdt de dyreste lukkede modellene. Koding, terminalarbeid og langvarige agentøkter er nettopp der virksomheter nå tester om AI kan gi mer enn chat og dokumenthjelp. Hvis en åpen modell faktisk kan levere godt nok på slike oppgaver, endrer det regnestykket for kost, dataflyt og leverandørvalg.

For det andre gjør lang kontekst agentstyring mer krevende. Én million tokens kan gi bedre arbeid over store kodebaser, loggdata og dokumentpakker. Det kan også gjøre feil vanskeligere å oppdage. Når agenten bærer mer historikk, mer kode og flere beslutninger inn i samme økt, må logging, tilgangsstyring og kildekontroll være på plass før modellen får skrive i produksjonsnære miljøer.

For det tredje kommer geopolitikken inn bakveien. MiniMax er en kinesisk aktør. For norske virksomheter betyr det ikke automatisk nei, men det betyr at vurderingen må være skarpere enn en vanlig modelltest. Databehandleransvar, jurisdiksjon, eksportkontroll, sanksjonsrisiko, logging, modellvekter og hvor inferens faktisk kjøres må inn i anskaffelsen. Det gjelder særlig i finans, energi, helse, forsvarsnære miljøer og offentlig sektor.

Hva CIO og CISO bør gjøre nå

Den riktige reaksjonen er ikke å bytte modell over natten. Den er å forberede en praktisk testløype.

Start med å skille mellom tre bruksmønstre: API-bruk hos MiniMax, bruk via MiniMax Code og eventuell lokal kjøring når vektene faktisk blir publisert. Risikoen er forskjellig i hvert spor. API-sporet handler om dataflyt og leverandøravtale. Kodeagent-sporet handler om tilgang til repoer, terminal og hemmeligheter. Lokal kjøring handler om modellstyring, patching, observability og hvem som eier inference-miljøet.

Deretter bør modellen testes på egne, ufarlige arbeidsoppgaver. Ikke spør om den kan skrive en demoapp. Mål den på faktiske refaktoreringer, feilsøkingsløp, testforbedringer og dokumentasjon i interne repoer uten sensitive data. Sammenlign mot dagens standardmodell, og mål tid spart, feilrate, testdekning og hvor mye menneskelig kontroll som trengs.

CISO bør samtidig behandle koding med agent som en privilegert operasjon. Agenten bør ikke ha bred terminaltilgang, hemmeligheter i miljøvariabler eller fri push-rett til repoer. Bruk kortlevde credentials, sandkasser, policy for verktøybruk og tydelig revisjonsspor. Hvis modellen skal lese store kontekster, må man vite hvilke data som faktisk går inn.

Den nøkterne vurderingen

MiniMax M3 kan bli viktig hvis vektene slippes som lovet og uavhengige tester bekrefter deler av ytelsen. Da får markedet en ny åpen modell som konkurrerer på områder der virksomheter faktisk bruker penger: kode, agenter, lange arbeidsøkter og multimodal analyse.

Men det er for tidlig å behandle M3 som et etablert enterprise-valg. Teknisk rapport mangler fortsatt. Vektene er varslet, ikke publisert. Benchmarkene er leverandørdata. Tilgjengelighet, lisensvilkår og praktisk drift må kontrolleres før modellen får plass i en styrt portefølje.

Likevel er signalet klart. Åpne modeller er ikke lenger bare et kostnadsalternativ for enklere tekstoppgaver. De prøver nå å ta posisjon i selve agentlaget. Det er der både gevinsten og risikoen ligger.

Kilder og medier

Primærkilde: MiniMax Research – https://www.minimax.io/blog/minimax-m3

MiniMax oppgir selv benchmarktall, arkitekturpåstander, API-tilgjengelighet og planlagt publisering av teknisk rapport og modellvekter. hogby.ai har behandlet tallene som leverandørpåstander, ikke uavhengig verifiserte resultater.

Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

AICIOCISO

Artificial Analysis: Claude Opus 5 tar ledelsen på agentbenchmark

Artificial Analysis plasserer Claude Opus 5 øverst på AA-Briefcase for agentisk kunnskapsarbeid. Viktigst for ledere: bedre analyse, men lange kjøretider og høy innsats gjør styring avgjørende.

26. juli 20265 min lesing

Artificial Analysis

Åpne saken

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken