Google lanserer Gemini 3.1 Flash-Lite — den raskeste og billigste modellen i Gemini 3-serien
Google har introdusert Gemini 3.1 Flash-Lite, sin mest kostnadseffektive AI-modell til dags dato. Modellen er utviklet spesielt for høyvolum-arbeidsflyter og tilbys utviklere via Gemini API i Google AI Studio, samt for bedrifter via Vertex AI.
Lynrask og billig
Gemini 3.1 Flash-Lite er priset til kun $0,25 per million input-tokens og $1,50 per million output-tokens. Den er 2,5 ganger raskere enn forgjengeren 2.5 Flash — målt i tid til første token — og leverer 45 % høyere output-hastighet ifølge Artificial Analysis-benchmark.
Til tross for den lave prisen opprettholder modellen kvalitet på linje med, eller bedre enn, 2.5 Flash på en rekke oppgaver.
Designet for skala
Modellen er optimalisert for brukstilfeller som:
- Innholdsmoderasjon i stor skala
- Oversettelse og lokalisering
- Generering av brukergrensesnitt
- Simulering og syntese
Tilgjengelighet
Gemini 3.1 Flash-Lite er allerede i bruk hos flere enterprise-kunder. Modellen er nå i preview-tilgang via Google AI Studio og Vertex AI, med bredere utrulling ventet i løpet av kort tid.
For CIOer som vurderer AI-infrastruktur, representerer Flash-Lite et interessant alternativ der latens og kostnad er kritiske faktorer — særlig i høyfrekvent sanntidsbehandling.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.