Hopp til hovedinnhold
 AI-nyheter, ferdig filtrert for ledere
SISTE:

OpenAI sender S-1 til SEC • Pentagon setter Alibaba og Baidu på militærliste • Anthropic lar Claude ta førstelinjen i analysearbeidet • Microsoft gjør Scout til desktop-agent i Frontier • Apple holder Siri AI tilbake i EU

Hume AI open-sourcer TADA: TTS-modellen som ikke kan hallusinere
CIOAITTSOpenSourceVoice

Hume AI open-sourcer TADA: TTS-modellen som ikke kan hallusinere

JH
Joachim Høgby
18. mars 202618. mars 20263 min lesingKilde:

Hume AI har lansert TADA – en open source tekst-til-tale-modell med MIT-lisens som løser et av bransjens vanskeligste problemer: innhallusinasjoner i lyd.

Hva gjør TADA spesiell?

Tradisjonelle TTS-modeller kan legge til ord, stavelser eller lyder som ikke finnes i inputteksten. TADA er bygget fra bunnen av for å garantere null innhallusineringer – modellen produserer nøyaktig det du gir den, ikke noe mer.

Tekniske spesifikasjoner:

  • RTF (Real-Time Factor): 0,09 – ekstremt rask (11x raskere enn sanntid)
  • 2048-token kontekstvindu – håndterer opptil 700 sekunder sammenhengende tale
  • MIT-lisensiert – fullstendig fri til kommersiell bruk
  • Open source på GitHub

Hvorfor betyr dette noe?

For applikasjoner der nøyaktighet er kritisk – juridiske dokumenter, medisinsk informasjon, kontraktsoppsummering via tale – er innhallusineringer et dealbreaker. TADA fjerner denne risikoen fundamentalt.

For JP Claw-prosjekter som voice agents og TTS-pipelines er dette verdt å vurdere som erstatning eller supplement til eksisterende løsninger (ElevenLabs, etc.) – spesielt for høyvolum-scenarioer der lisenspris er en faktor.

Hva betyr MIT-lisens?

Alt. Du kan bruke TADA i kommersielle produkter uten royalties, uten API-avhengighet, og helt on-premises. Kombinert med den lave RTF gjør dette TADA til et sterkt alternativ for bedrifter med privacy-krav.

Kilde: AI Advances / ai.gopubby.com

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.