CIO CFOCTOCISOStyreAI FinOpsAI StrategyModel RoutingAI InfrastructureEnterprise AIAI AgentsAgentic AIInferenceOpenAIAnthropicFireworks AIHarveyKostnadskontrollLeverandørstyringRisikostyring

Billige modeller tvinger frem ny AI-kostnadsstyring

Joachim Høgby

10. juni 202610. juni 20264 min lesingKilde: TechCrunch

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Det neste store AI-skiftet kan bli mindre glamorøst enn nye frontier-modeller: billigere modeller som gjør jobben godt nok. TechCrunch peker på at kostnadspresset allerede tvinger selskaper til å vurdere små og rimelige modeller i stedet for å sende alt til de dyreste systemene.

Det er en viktig endring for CIO-er og CFO-er. De siste årene har mange AI-prosjekter hatt én enkel standard: bruk den sterkeste modellen tilgjengelig. Den strategien fungerer i demoer og tidlige piloter. Den blir dyr når agentene begynner å kjøre mange steg, sende store kontekster og bli en del av ordinær arbeidsflyt.

TechCrunch viser til en vurdering fra Coinbase-gründer Brian Armstrong om at 80 prosent av arbeidslastene kan flytte til modeller som er 99 prosent billigere innen 12 til 18 måneder, mens de siste 20 prosentene fortsatt bruker de mest avanserte modellene. Tallet er en spissformulering, men retningen er viktig: AI-økonomien går fra størst mulig modell til riktig modell per oppgave.

Fra modellvalg til ruting

For virksomheter betyr dette at modellstrategi ikke lenger kan være en liste over favorittleverandører. Den må bli en rutingstrategi. Enkle klassifiseringsoppgaver, oppsummeringer, søk, standard kundedialog og intern tekstbearbeiding trenger sjelden samme modell som juridisk analyse, sikkerhetsvurdering eller kompleks kodeendring.

Den praktiske arkitekturen blir derfor en portefølje. Små modeller tar volumet. Store modeller tar oppgaver med høy usikkerhet, høy verdi eller høy risiko. Mellom dem ligger evalueringslogikk, policy, logging og fallback. Det er der styringen ligger.

TechCrunch peker på et eksempel fra juridisk AI-selskapet Harvey, som sammen med Fireworks AI skal ha redusert inferenskostnadene med tre ganger uten å senke kvaliteten. Løsningen var ikke å erstatte en sterk modell overalt, men å kombinere modeller og flytte de mest krevende oppgavene til den tyngste modellen. Det er akkurat slik moden AI-drift kommer til å se ut.

Kostnaden ligger i løkkene

En enkelt forespørsel til en språkmodell kan være billig. En agent er noe annet. Agenten gjør gjerne mange kall, leser filer, henter kontekst, tester hypoteser, skriver om og prøver igjen. Hvis hvert steg sendes til den dyreste modellen, blir kostnaden fort styrende for hele produktet.

Dette treffer spesielt utviklerverktøy, kundeservice, saksbehandling, analyse og intern kunnskapsstøtte. Det er områder der bruken kan vokse raskt fordi terskelen for å spørre er lav. Uten kostnadskontroll blir suksess et problem. Jo mer folk bruker verktøyet, desto mer sprenger budsjettet.

AI FinOps må derfor flyttes inn i designfasen. Det holder ikke å se på månedlig faktura etterpå. Team må vite hva en arbeidsflyt koster per fullført oppgave, ikke bare per token. De må måle hvor ofte modellen må eskalere til en dyrere modell, hvor mye kontekst som faktisk trengs, og hvor ofte svar må kjøres på nytt fordi kvaliteten er for lav.

Kvalitet må måles, ikke antas

Den største risikoen med billige modeller er falsk økonomi. Hvis en svakere modell gir flere feil, mer manuell kontroll eller dårligere kundeopplevelse, kan den bli dyrere i praksis. Derfor er evalueringsregimet viktigere enn prislisten.

Virksomheter bør bygge et testsett for sine egne oppgaver. Ikke generelle benchmark-tabeller. Egne kontrakter, egne kundespørsmål, egne kodebaser, egne avvikssaker og egne dokumentmaler. Først da kan man se hvilke oppgaver som tåler billigere modeller, og hvilke som må holdes på toppnivå.

Det samme gjelder risiko. En liten modell kan være riktig for en intern oppsummering, men feil for en beslutning som påvirker kreditt, helse, sikkerhet eller juridisk ansvar. Det er ikke modellstørrelsen alene som avgjør. Det er oppgaven, datagrunnlaget, kontrollnivået og konsekvensen av feil.

Leverandørmakten endres

Hvis store deler av arbeidslasten flyttes til mindre modeller, svekkes noe av makten til de største modell-labene. Kunder får flere alternativer: åpne modeller, spesialiserte modeller, billigere varianter fra samme leverandør og uavhengige inferensplattformer. Det betyr ikke at frontier-modeller mister rollen sin. De blir heller premium-laget i en bredere AI-stack.

For innkjøp er dette en mulighet. Avtaler bør ikke bare handle om tilgang til én modellfamilie. De bør dekke ruting, datahåndtering, logging, evalueringsstøtte, kostnadsgrenser, latency, fallback og rett til å bytte modell. Den som låser seg til én dyr standardmodell for alle oppgaver, risikerer å betale for mye og lære for lite.

For styret er spørsmålet enkelt: Har virksomheten kontroll på enhetsøkonomien i AI-bruken? Hvis svaret er nei, er AI-satsingen fortsatt et eksperiment. Hvis svaret er ja, kan AI skaleres uten at budsjettet blir et lotteri.

Hva norske ledere bør gjøre nå

Start med tre grep. Først: kartlegg de største AI-arbeidslastene etter faktisk kostnad per oppgave. Ikke etter antall brukere. Deretter: bygg et enkelt eval-sett for de 10 viktigste oppgavene. Til slutt: test minst én billigere modell og én rutingmekanisme mot dagens løsning.

Dette er ikke et argument for å velge billigst. Det er et argument for å slutte å bruke dyrest som standard. AI-markedet modnes når virksomheter kan skille mellom oppgaver som krever maksimal intelligens og oppgaver som krever stabil, billig og kontrollerbar produksjon.

Det skiftet er godt nytt for seriøse virksomheter. Det gjør AI mindre til et prestisjeprosjekt og mer til driftsdisiplin. Litt kjedeligere. Mye mer nyttig.

Kilder og medier

Kilde: TechCrunch, "Can tech companies learn to love cheaper AI models?", https://techcrunch.com/2026/06/09/can-tech-companies-learn-to-love-cheaper-models/

Kildekreditering: TechCrunch. Saken er skrevet med norsk CIO-, CFO- og styrevinkel på modellruting, AI FinOps og kostnadsstyring.

Thumbnail: OpenAI Image 2 / hogby.ai

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

Breaking

CIOCISOAI-sikkerhet

NVIDIA og Microsoft åpner AI-sikkerhetsallianse

NVIDIA, Microsoft og flere partnere starter Open Secure AI Alliance. Målet er åpne verktøy for AI-forsvar, sårbarhetshåndtering og respons på agentangrep.

27. juli 20264 min lesing

NVIDIA Blog

Åpne saken

AI-modellerAgenterOpenAI

OpenAI viser ChatGPT Work som agent for ekte arbeidsflyt

Sam Altman beskriver ChatGPT Work som en agent som bruker historikk, bygger en fullstack-side, koordinerer valg og klargjør Gmail-utkast fra én mobilprompt.

27. juli 20264 min lesing

Sam Altman / OpenAI

Åpne saken

CIOCISOAI-modeller

NVIDIA: Nemotron 3 Ultra slår åpne modeller i chipdesign-koding

NVIDIA hevder Nemotron 3 Ultra gir høyest treffsikkerhet og lavest tokenbruk blant åpne modeller i agentisk RTL-koding. Det peker rett mot flaskehalsen i chipdesign.

27. juli 20265 min lesing

NVIDIA Technical Blog

Åpne saken