Google gjør sanntidstolking til Gemini-API
Google åpner Gemini 3.5 Live Translate for utviklere og starter utrulling i Google Translate og Google Meet. Modellen oversetter tale til tale i nær sanntid, oppdager mer enn 70 språk og skal bevare tonefall, tempo og stemmeleie bedre enn tradisjonell maskinoversettelse.
For norske virksomheter er dette mer enn en forbrukerfunksjon. Google gjør sanntidstolking til en API-komponent. Det betyr at språkbarrierer kan bygges direkte inn i kundeservice, møter, opplæring, feltarbeid og interne arbeidsflyter. Når teknologien flyttes fra app til plattform, endrer den også kravene til CIO, DPO og sikkerhetsansvarlige.
Google sier modellen ligger bare noen sekunder bak den som snakker. Den venter ikke på at en hel tur i samtalen skal avsluttes før oversettelsen starter. Det gjør løsningen mer relevant for faktiske samtaler, der rytme og avbrudd betyr mye.
Fra oversettelsesapp til infrastruktur
Gemini 3.5 Live Translate er tilgjengelig i public preview gjennom Gemini Live API og Google AI Studio. Google oppgir modellnavnet gemini-3.5-live-translate-preview i dokumentasjonen. Modellen tar lyd inn og kan returnere oversatt lyd og teksttranskripsjon.
Samtidig rulles funksjonen ut i Google Translate på Android og iOS. På Android kommer også en lyttemodus der telefonen kan brukes mot øret uten hodetelefoner. For Google Meet starter en privat preview for utvalgte Google Workspace-kunder denne måneden, med bredere utrulling senere i år.
Det er Meet-delen som gjør saken særlig relevant for ledere. Google sier taleoversettelse i Meet går fra fem språk til over 70 språk. Selskapet beskriver mer enn 2 000 språkkombinasjoner i møter, ikke bare oversettelse til og fra engelsk. Norsk er oppført som støttet språk i Google AI-dokumentasjonen, med kodene no og nb.
I praksis kan dette bli en ny standardfunksjon i møter mellom hovedkontor, leverandører, kunder og feltorganisasjoner. Det kan redusere friksjon i internasjonale prosjekter. Det kan også skape nye forventninger fra ansatte og kunder om at språk ikke lenger skal være en praktisk sperre.
Bedrifter får nye bruksområder og nye risikopunkter
Teknologien passer godt i kontaktflater der feil språk koster tid eller penger. Kundesentre kan gi støtte på flere språk. Reiseliv og transport kan håndtere samtaler mellom ansatte og kunder. Helse, beredskap og offentlig sektor kan få bedre førstehåndsdialog, men der blir kravene til kvalitet, logging og ansvar langt strengere.
Google peker selv på Grab som testpartner. Ifølge Google har Grab-brukere mer enn 10 millioner talesamtaler i måneden gjennom appen. Det viser hvilken type volum selskapet sikter mot: ikke bare enkeltmøter, men løpende kommunikasjon i operasjonelle tjenester.
CIO-er bør derfor ikke behandle dette som en isolert AI-demo. Når sanntidstolking blir API, blir det en del av arkitekturen. Da må virksomheten vite hvor lyd sendes, hva som lagres, hvordan samtykke håndteres, hvordan språkfeil fanges opp og hvem som har ansvar når oversettelsen blir feil.
Kvalitet er bedre, men ikke garantert
Google sier all generert lyd vannmerkes med SynthID. Det er et viktig grep, særlig hvis oversatt tale skal brukes i tjenester der man må kunne skille menneskelig tale fra generert lyd. Samtidig viser DeepMind-modellkortet at teknologien har klare begrensninger.
Modellen kan få problemer med raske språkskifter, ikke-innfødte aksenter, lignende språk, bakgrunnslyd og lange pauser. Google peker også på mulig stemmeinkonsistens og feil kjønnstildeling i enkelte tilfeller. Det er ikke små fotnoter. For virksomheter som bruker dette i kundedialog eller interne beslutningsmøter, må slike feil inn i risikovurderingen.
Det praktiske spørsmålet er hva oversettelsen skal brukes til. I en uformell salgssamtale kan «godt nok» være nok. I kontraktsforhandlinger, HMS, helseråd, juridiske vurderinger eller personalsaker er terskelen en annen. Der bør sanntidstolking støtte mennesket, ikke erstatte ansvarlig tolkning og dokumentasjon.
Norsk ledervinkel
For norske selskaper med nordiske, europeiske eller globale verdikjeder er dette en konkret produktivitetsmulighet. Mange virksomheter taper tid på språk i møter, opplæring og leverandøroppfølging. Hvis Gemini 3.5 Live Translate fungerer stabilt nok, kan det kutte ventetid og gjøre mindre språkgrupper mer operative i felles prosesser.
Men dette bør pilots som en plattformkomponent, ikke som et leketøy. Start med lavrisiko-scenarioer: intern opplæring, teknisk support, reise- og feltkommunikasjon, eller flerspråklige prosjektmøter der referat og beslutninger fortsatt kvalitetssikres. Mål feilrate, forsinkelse, brukeropplevelse og behov for menneskelig etterkontroll.
Google har også gitt konkurrentene et tydelig signal. Tale, møte, oversettelse og agentfunksjoner smelter sammen. Den som eier møteplattformen, eier mer av arbeidsflyten. Det gjør leverandørstyring viktigere. Hvis språkstøtte bygges dypt inn i Google Workspace, Microsoft 365 eller andre plattformer, bør virksomheten vurdere portabilitet, databehandling og avhengighet før funksjonen blir kritisk infrastruktur.
Gemini 3.5 Live Translate er derfor en fersk AI-nyhet med praktisk betydning. Ikke fordi alle møter nå blir perfekte. Men fordi sanntidstale går fra laboratorieeffekt til noe som kan bygges inn i vanlige arbeidsprosesser.
Kilder og medier
Primærkilde: Google, https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
Google AI-dokumentasjon for Live Translate: https://ai.google.dev/gemini-api/docs/live-api/live-translate
Google AI-modellsiden: https://ai.google.dev/gemini-api/docs/models/gemini-3.5-live-translate-preview
Google DeepMind modellkort: https://deepmind.google/models/model-cards/gemini-3-5-audio/
Thumbnail: OpenAI Image 2 / hogby.ai
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.