Google gjør video til en AI-agent
Google lanserer Gemini Omni Flash, den første modellen i en ny Omni-familie som skal lage og redigere video fra flere typer input. Modellen rulles ut i Gemini-appen, Google Flow og YouTube Shorts. Google sier at API-er for utviklere og enterprise-kunder kommer i løpet av de neste ukene.
Det gjør lanseringen større enn en ny kreativ demo. Google flytter generativ video inn i verktøy folk allerede bruker, samtidig som selskapet varsler en enterprise-kanal. For norske ledere betyr det at AI-video raskt går fra kampanjeidé til styrt produksjonskapasitet. Da må policy, godkjenning, rettigheter og sporbarhet på plass før verktøyet blir en snarvei rundt dagens kontrollpunkter.
Omni Flash starter med video. Google beskriver Omni som en modell som kan kombinere bilder, lyd, video og tekst som input, og lage nye videoer som er forankret i Geminis kunnskap om verden. Brukeren kan også redigere gjennom samtale. Hver instruksjon bygger videre på den forrige, med mål om at figurer holder seg stabile, fysikken henger sammen og scenen husker hva som kom før.
Det er nettopp her CIO, CISO, DPO og kommunikasjonsledere bør følge ekstra nøye med. Når video kan endres i flere steg med naturlig språk, blir grensen mellom produksjon, redigering og publisering svakere. Det kan spare tid. Det kan også skape en ny klasse av innholdsrisiko der ingen helt vet hvilken prompt, referansefil eller beslutning som skapte sluttresultatet.
Fra kreativt verktøy til produksjonslinje
Google sier at Gemini Omni Flash rulles ut globalt til Google AI Plus-, Pro- og Ultra-abonnenter gjennom Gemini-appen og Google Flow. Den rulles også ut uten kostnad til brukere av YouTube Shorts og YouTube Create App fra denne uken.
Det gir Google en distribusjon få konkurrenter kan matche. Flow dekker den mer profesjonelle produksjonsflaten. Gemini-appen senker terskelen for vanlige brukere. YouTube Shorts gjør modellen direkte relevant for voluminnhold, reklame, employer branding, produktkommunikasjon og kundedialog.
For virksomheter er det ikke nok å spørre om kvaliteten er god. Spørsmålet er hvor videoen oppstår, hvem som har lov til å bruke hvilke referanser, og hvordan virksomheten kan dokumentere at publisert materiale er godkjent. En markedssjef ser rask produksjon. En CISO ser lekkasje av bilder, lyd, produktprototyper og kundemateriale. En DPO ser biometri, stemmebruk og identifiserbare personer. Alle tre har rett.
Google peker på flere konkrete kapasiteter. Video kan endres med naturlige instruksjoner. Handling kan byttes ut. Nye figurer og objekter kan legges inn. Brukeren kan endre miljø, kameravinkel, stil og detaljer over flere runder uten å miste sammenheng med den opprinnelige scenen. Modellen skal også bruke Geminis kunnskap til å lage forklaringsvideoer og visualisere komplekse konsepter, ikke bare lage pene klipp.
Det er attraktivt for opplæring, salg, internkommunikasjon og produktdemoer. Men det betyr også at AI-video blir en del av kunnskapsarbeidet, ikke bare designavdelingen. Når en fagperson kan lage en forklaringsfilm fra tekst og referansemateriale, må virksomheten behandle video som dokumentasjon, ikke pynt.
Stemme, avatarer og SynthID
Den mest følsomme delen av lanseringen er avatarer og lyd. Google sier at brukere til å begynne med kan lage videoer med sin egen stemme gjennom Avatars, som skaper en digital versjon av brukeren. Selskapet sier samtidig at bredere redigering av lyd og tale fortsatt testes før det eventuelt åpnes mer.
Det er en fornuftig begrensning, men den fjerner ikke styringsbehovet. Bedrifter trenger regler for hvem som kan lage syntetiske versjoner av ansatte, ledere, kunder eller ambassadører. De trenger samtykke, lagringstid, bruksformål og sletting. De trenger også en enkel regel for hva som aldri skal lages, selv om verktøyet kan.
Google sier at alle videoer laget med Omni får en usynlig SynthID-vannmerking. Innholdet skal kunne verifiseres gjennom Gemini-appen, Gemini i Chrome og Google Search. Det er viktig, men ikke tilstrekkelig som intern kontroll. Vannmerking hjelper mottakere og plattformer. Den erstatter ikke logging av kilder, prompt, godkjenning og publiseringsansvar inne i virksomheten.
For norske selskaper er dette også en anskaffelsessak. Når enterprise-API-er kommer, bør kravene være klare før første pilot: databehandling, region, logging, tilgangsstyring, rettigheter til input og output, modelltrening, revisjonsspor, vannmerking og sperrer mot bruk av personer uten samtykke. Hvis innkjøp venter til markedsavdelingen allerede har bygd arbeidsflyt rundt verktøyet, kommer governance for sent.
Hva ledere bør gjøre nå
Gemini Omni Flash gjør tre ting samtidig. Den senker kostnaden ved å lage video. Den flytter redigering fra ekspertverktøy til samtale. Og den kobler video til samme modellplattform som mange virksomheter allerede vurderer for søk, kontorarbeid, agenter og utvikling.
Det betyr at AI-video bør inn i den samme styringsmodellen som annen generativ AI. Ikke som et isolert kreativt unntak. Minimum bør virksomheter definere hvilke data som kan lastes opp, hvem som kan bruke ekte stemmer og ansikter, hvilke klasser av innhold som krever juridisk eller kommunikasjonsfaglig godkjenning, og hvordan syntetisk innhold merkes eksternt.
CISO bør særlig se på referansefiler. Google beskriver hvordan Omni kan bruke bilder, video, lyd og tekst som input. Slike filer kan inneholde kundedata, ansatte, lokasjoner, skjermer, dokumenter, prototyper og annen informasjon som ikke bør havne i en ekstern AI-tjeneste uten kontroll. DPO bør se på stemme og avatarer. CFO bør se på hvordan verktøyet prises når det flyttes fra brukerabonnement til API og produksjonsvolum.
Lanseringen er også et signal om hvor konkurransen går. OpenAI, Google, Meta og andre kjemper ikke bare om beste modell. De kjemper om arbeidsflyten der innhold blir til. Hvis Google lykkes med å gjøre Flow, Gemini og YouTube Shorts til én sammenhengende produksjonsflate, blir låsingen sterkere. Da bør virksomheter tenke portefølje: hvilke leverandører får lage, lagre og distribuere bedriftens visuelle materiale?
Google har ikke publisert alle enterprise-detaljene ennå. Det er nettopp derfor tidspunktet er godt for ledere. Det er enklere å sette krav før API-ene tas i bruk enn å rydde etterpå. AI-video er ikke lenger en sidegren. Den er på vei inn i hverdagsverktøyene.
Kilder og medier
Primærkilde: Google, "Introducing Gemini Omni", https://blog.google/intl/en-ie/products/gemini-omni/
Kildekreditering: Google / Google DeepMind.
Thumbnail: OpenAI Image 2 / hogby.ai.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.