CIOCTOCISO CFOStyreMoonshot AIKimi K2.7 CodeAI AgentsKodeagenterDeveloper ToolsOpen WeightsAI InfrastructureInferenceAI FinOpsModel RoutingEnterprise AIAI GovernanceDevSecOpsLeverandørstyringRisikostyring

Kimi presser prisen på kodeagenter ned

Joachim Høgby

13. juni 202613. juni 20265 min lesingKilde: Moonshot AI

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Moonshot AI har sluppet Kimi K2.7 Code, en ny åpen vekts modell rettet mot kodeagenter og lange utviklingsoppgaver. Modellen ligger på Hugging Face, har én billion totale parametere og bruker 32 milliarder aktive parametere per token i en mixture-of-experts-arkitektur.

Det viktigste er ikke at Kimi plutselig slår de dyreste amerikanske modellene på alt. Det gjør den ikke. Det viktige er at avstanden i kvalitet begynner å bli liten nok til at prisen blir et strategisk spørsmål for utviklingsorganisasjoner.

Moonshot oppgir 256 000 token kontekstvindu, støtte for verktøykall, JSON-modus, automatisk kontekstcaching og multimodal input. Modellen er laget for agentarbeid, ikke bare chat. Den skal håndtere lange kodeoppgaver, flere runder med verktøybruk og vedvarende arbeidsflyter bedre enn forgjengeren K2.6. Selskapet sier også at modellen bruker omtrent 30 prosent færre tenke-tokens enn K2.6. Det betyr lavere kostnad i oppgaver der modellen ellers brenner mye budsjett på resonnering.

Prislisten er aggressiv. Kimi API Platform oppgir 0,95 dollar per million input-tokens ved cache miss, 0,19 dollar ved cache hit og 4 dollar per million output-tokens. Til sammenligning rapporterer The Decoder at GPT-5.5 ligger på 5 dollar inn og 30 dollar ut, mens Claude Opus 4.8 ligger på 5 dollar inn og 25 dollar ut. Output-prisen er dermed en brøkdel av toppmodellene.

For norske CIO-er og CTO-er er dette mer praktisk enn det kan høres ut. Kodeagenter er ikke et vanlig SaaS-sete. De kan kjøre i timer, lese store repoer, gjøre mange forsøk og bruke mye output. Når bruken går fra piloter til hverdagsflyt i utvikling, CI, test, migrering og dokumentasjon, blir tokenkost en driftskostnad. Da holder det ikke å spørre hvilken modell som er best. Spørsmålet blir hvilken modell som er god nok for riktig type arbeid.

Ikke best, men billig nok til å endre flyten

Moonshots egen modellkort viser at Kimi K2.7 Code fortsatt ligger bak GPT-5.5 og Claude Opus 4.8 på flere kodebenchmarker. På Kimi Code Bench v2 scorer K2.7 Code 62,0, mot 69,0 for GPT-5.5 og 67,4 for Claude Opus 4.8. På Program Bench scorer den 53,6, mot 69,1 for GPT-5.5 og 63,8 for Claude.

Bildet er ikke entydig. På MCPMark Verified, som tester agentbruk mot miljøer som Notion, GitHub, filsystem, Postgres og Playwright, oppgir Moonshot 81,1 for K2.7 Code. Det er lavere enn GPT-5.5 på 92,9, men høyere enn Claude Opus 4.8 på 76,4. Som alltid må slike tall behandles med nøkternhet. Benchmarker er ikke produksjon. Men de viser retningen: rimeligere modeller nærmer seg oppgaver som tidligere var forbeholdt de dyreste modellene.

Det gir en annen arkitektur for AI-utvikling. De dyreste modellene kan reserveres til design, vanskelige feilsøkingsløp, sikkerhetskritiske endringer og arbeid med høy kontekstverdi. Billigere kodeagenter kan kjøre flere parallelle forsøk, lage førsteutkast, oppdatere tester, rydde teknisk gjeld og forberede pull requests.

Dette er ikke bare et innkjøpspoeng. Det er et styringspoeng. Når prisen faller, øker fristelsen til å slippe agentene friere. Da må virksomheten ha bedre kontroll på hvilke repoer agentene får lese, hvilke secrets de kan se, hvilke verktøy de kan kalle, og hvor endringer må stoppes for menneskelig review. Billigere tokens fjerner ikke risiko. De gjør det bare enklere å skalere den.

Åpen vektsmodell gir nye valg

Kimi K2.7 Code er tilgjengelig som åpen vekts modell under en modifisert MIT-lisens. Den kan kjøres via Moonshots API, Kimi Code CLI og inference-motorer som vLLM og SGLang. Modellen har også native INT4-kvantisering, som kan gjøre selvhosting og billigere inferens mer realistisk for enkelte miljøer.

For regulerte virksomheter er dette interessant, men ikke automatisk trygt. Åpne vekter gir mer valgfrihet, bedre mulighet for testing og mindre direkte binding til én amerikansk leverandør. Samtidig krever det mer intern kompetanse på modellhosting, logging, policy, dataklassifisering og leverandørvurdering. Hvis modellen brukes via API, må databehandler- og jurisdiksjonsspørsmål uansett avklares.

Den praktiske anbefalingen er enkel: bygg en modellruting for kodeagenter nå. Ikke la utviklerne velge modell tilfeldig per verktøy. Lag oppgaveklasser. Definer hva som kan kjøres på rimelige modeller, hva som krever frontier-modell, og hva som ikke skal sendes ut av egne miljøer. Mål kost per godkjent pull request, ikke bare pris per token.

Kimi K2.7 Code er et tegn på at markedet for kodeagenter går inn i priskonkurranse. Det betyr ikke at toppmodellene mister verdien sin. Det betyr at virksomheter som bare kjøper den dyreste modellen til alt, sannsynligvis betaler for mye. De som bare jager billigste token, tar på seg skjult risiko.

Vinnerne blir de som klarer å rute arbeidet riktig. Litt kjedelig. Veldig lønnsomt.

Kilder og medier

Primærkilde: Moonshot AI modellkort for Kimi K2.7 Code på Hugging Face, sist oppdatert 12. juni 2026: https://huggingface.co/moonshotai/Kimi-K2.7-Code
Offisiell priskilde: Kimi API Platform, "Coding Model Kimi K2.7 Code Pricing": https://platform.kimi.ai/docs/pricing/chat-k27-code
Sekundærkilde: The Decoder, "Moonshot's open model Kimi K2.7 Code undercuts GPT-5.5 and Claude by up to 12x on price per token": https://the-decoder.com/moonshots-open-model-kimi-k2-7-code-undercuts-gpt-5-5-and-claude-by-up-to-12x-on-price-per-token/
Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

StyreCIOAI-infrastruktur

Nvidia gir Sutskevers SSI mer regnekraft i AI-kappløpet

Safe Superintelligence får tilgang til Nvidias Vera Rubin-plattform og skal skalere forskningen kraftig. For styrer er saken et nytt tegn på at AI-ledelse styres av compute, kapital og tilgang.

28. juli 20264 min lesing

TechCrunch

Åpne saken

CISOCIOCybersikkerhet

Vercel viser prislappen på AI-drevet sårbarhetsjakt

Vercels DeepsecBench måler hvor godt ulike modeller finner sikkerhetsfeil i kode. Tallene viser at AI-skanning blir billigere, men at funnrate og styring fortsatt er harde krav.

28. juli 20264 min lesing

Vercel

Åpne saken

CIOStyreArbeidsliv

OpenAI måler hvordan AI flytter arbeid mellom roller

OpenAIs nye arbeidsrapport viser at ChatGPT-brukere i økende grad tar oppgaver fra andre fagområder. For ledere betyr det mindre stillingslogikk og mer styring av faktisk arbeid.

28. juli 20264 min lesing

OpenAI

Åpne saken