GoogleGeminiAPIEnterpriseCIO

Google lanserer Flex og Priority Inference i Gemini API

Joachim Høgby

3. april 20263. april 20263 min lesingKilde:

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Google introduserte i dag to nye prisnivåer for Gemini API: Flex Inference og Priority Inference. Det gir utviklere og bedrifter langt bedre kontroll over balansen mellom kostnad og pålitelighet.

Flex Inference tilbyr 50 prosent rabatt sammenlignet med standard API-pris. Det fungerer på opportunistisk kapasitet i lavtrafikktider og er beregnet for arbeidsbelastninger der noe forsinkelse er akseptabelt, for eksempel bakgrunns-CRM-oppdateringer, store forskningssimuleringer og agentiske arbeidsflyter. Forespørsler kan forkastes dersom standard trafikk øker, og brukere må implementere egne retry-mekanismer.

Priority Inference er premiumnivået. Det koster 75 til 100 prosent mer enn standard, men garanterer lavest mulig latens og høyest pålitelighet. Trafikken prioriteres alltid foran standard og Flex, og forkastes aldri. I tilfeller der kapasiteten overskrides, nedgraderes forespørsler automatisk til standard i stedet for å feile. Nivået passer for live kundechatboter, sanntids svindeldeteksjon og forretningskritiske kopilot-løsninger.

Begge nivåene er tilgjengelige via GenerateContent API og Interactions API. Priority Inference krever Tier 2 eller Tier 3 betalende prosjekter.

For CIO-er og utviklingsteam som allerede bruker Gemini API i produksjon er dette en veldig konkret forbedring: man trenger ikke lenger å overbetale for alle API-kall bare for å sikre seg pålitelighet der det faktisk er kritisk.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

CIOCISOModeller

Google gjør Gemini raskere, billigere og mer sikkerhetsrettet

Google DeepMind lanserer Gemini 3.6 Flash, 3.5 Flash-Lite og en egen Flash Cyber-variant. For ledere handler slippet mindre om demoer og mer om kost, agentdrift og sikkerhetsstyring.

23. juli 20265 min lesing

Google DeepMind

Åpne saken

CIOCISODPO

Google kobler AI-søk til apper og gjør tilgangsstyring mer krevende

Google lar brukere koble apper som Instacart, Canva og YouTube Music direkte til AI Mode i Search. For virksomheter peker dette mot et nytt kontrollproblem: AI-grensesnittet blir et handlingslag over andre tjenester.

19. juli 20264 min lesing

Google Blog

Åpne saken

CIOCISOCTO

Google gjør Gemini til datamaskinbruker

Google bygger computer use direkte inn i Gemini 3.5 Flash. For ledere betyr det at agentstyring må flyttes fra pilotrommet til tilgang, logging og godkjenning.

26. juni 20266 min lesing

Google

Åpne saken