Mistral lanserer Voxtral TTS: åpen stemme-AI som kloner stemmer fra tre sekunder
Mistral AI har lansert sin første tekst-til-tale-modell, Voxtral TTS, og gjør den tilgjengelig som åpne vekter. Modellen ble sluppet 26. mars 2026 og posisjoneres som et direkte alternativ til ElevenLabs og OpenAI TTS.
Voxtral TTS er en 4B-parameter-modell bygget på Ministral 3B. Den støtter ni språk — engelsk, fransk, tysk, spansk, nederlandsk, portugisisk, italiensk, hindi og arabisk — og kan klone en stemme fra bare tre sekunder med referanselyd. Latensen er 70 millisekunder for en ti sekunders lydprøve.
Modellen er tilgjengelig via API og på Hugging Face under en ikke-kommersiell lisens. Mistral fremhever at den er lett nok til å kjøre lokalt på laptop, smarttelefon og edge-enheter.
For bedrifter som bygger stemmeassistenter, kundeservice eller salgssystemer er dette interessant: åpen kildekode betyr full kontroll, ingen avhengighet av tredjepartstjenester og mulighet for lokal kjøring uten API-kostnader. Konkurransen i TTS-markedet tilspisser seg markant.
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.