Hopp til hovedinnhold
 AI-nyheter, ferdig filtrert for ledere
SISTE:

USA famler med forhåndstilsyn av AI-modeller • Banktopp varsler dyrere AI-agenter • GitHub gjør Copilot-bruk til løpende AI-kostnad • Google gjør Gemini Spark til døgnagent • NVIDIA vil gjøre bankdata til egne AI-modeller

GPT-5.4 Thinking scorer 83 % på GDPVal – over menneskelig ekspertnivå på verdiskapende oppgaver

JH
Joachim Høgby
16. mars 202616. mars 20263 min lesingKilde: Fortune

AI passerer ekspertnivå på arbeid som faktisk gir verdi

OpenAI har lansert GPT-5.4 «Thinking», og det er ikke en inkrementell oppdatering. Modellen har scoret 83,0 % på GDPVal-benchmarken – en test designet for å evaluere AI-ytelse på oppgaver som faktisk skaper økonomisk verdi, ikke bare tekstgenerering eller quiz-spørsmål.

Min take:

83 % på GDPVal er et tall som bør skrives inn i neste styrepresentasjon. Ikke for å skape frykt, men for å kalibrere tempoet i AI-adopsjon. Vi er ikke lenger i «nær fremtid»-fasen – vi er i «nå»-fasen.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.