Hopp til hovedinnhold
Fredag 24. april 2026AI-nyheter, ferdig filtrert for ledere
SISTE:
DeepSeek åpner V4 Preview med 1M kontekst og API-kompatibilitetOpenAI lanserer GPT-5.5 for ChatGPT og CodexAnthropic og Amazon utvider AI-alliansen med 5 GW kapasitet og ny investeringDeepSeek åpner V4 Preview med 1M kontekst og API-kompatibilitetOpenAI lanserer GPT-5.5 for ChatGPT og CodexAnthropic og Amazon utvider AI-alliansen med 5 GW kapasitet og ny investering
Google lanserer Flex og Priority Inference i Gemini API
GoogleGeminiAPIEnterpriseCIO

Google lanserer Flex og Priority Inference i Gemini API

JH
Joachim Høgby
3. april 20263. april 20263 min lesingKilde:

Google introduserte i dag to nye prisnivåer for Gemini API: Flex Inference og Priority Inference. Det gir utviklere og bedrifter langt bedre kontroll over balansen mellom kostnad og pålitelighet.

Flex Inference tilbyr 50 prosent rabatt sammenlignet med standard API-pris. Det fungerer på opportunistisk kapasitet i lavtrafikktider og er beregnet for arbeidsbelastninger der noe forsinkelse er akseptabelt, for eksempel bakgrunns-CRM-oppdateringer, store forskningssimuleringer og agentiske arbeidsflyter. Forespørsler kan forkastes dersom standard trafikk øker, og brukere må implementere egne retry-mekanismer.

Priority Inference er premiumnivået. Det koster 75 til 100 prosent mer enn standard, men garanterer lavest mulig latens og høyest pålitelighet. Trafikken prioriteres alltid foran standard og Flex, og forkastes aldri. I tilfeller der kapasiteten overskrides, nedgraderes forespørsler automatisk til standard i stedet for å feile. Nivået passer for live kundechatboter, sanntids svindeldeteksjon og forretningskritiske kopilot-løsninger.

Begge nivåene er tilgjengelige via GenerateContent API og Interactions API. Priority Inference krever Tier 2 eller Tier 3 betalende prosjekter.

For CIO-er og utviklingsteam som allerede bruker Gemini API i produksjon er dette en veldig konkret forbedring: man trenger ikke lenger å overbetale for alle API-kall bare for å sikre seg pålitelighet der det faktisk er kritisk.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.