Hume AI open-sourcer TADA: TTS-modellen som ikke kan hallusinere
Hume AI har lansert TADA – en open source tekst-til-tale-modell med MIT-lisens som løser et av bransjens vanskeligste problemer: innhallusinasjoner i lyd.
Hva gjør TADA spesiell?
Tradisjonelle TTS-modeller kan legge til ord, stavelser eller lyder som ikke finnes i inputteksten. TADA er bygget fra bunnen av for å garantere null innhallusineringer – modellen produserer nøyaktig det du gir den, ikke noe mer.
Tekniske spesifikasjoner:
- RTF (Real-Time Factor): 0,09 – ekstremt rask (11x raskere enn sanntid)
- 2048-token kontekstvindu – håndterer opptil 700 sekunder sammenhengende tale
- MIT-lisensiert – fullstendig fri til kommersiell bruk
- Open source på GitHub
Hvorfor betyr dette noe?
For applikasjoner der nøyaktighet er kritisk – juridiske dokumenter, medisinsk informasjon, kontraktsoppsummering via tale – er innhallusineringer et dealbreaker. TADA fjerner denne risikoen fundamentalt.
For JP Claw-prosjekter som voice agents og TTS-pipelines er dette verdt å vurdere som erstatning eller supplement til eksisterende løsninger (ElevenLabs, etc.) – spesielt for høyvolum-scenarioer der lisenspris er en faktor.
Hva betyr MIT-lisens?
Alt. Du kan bruke TADA i kommersielle produkter uten royalties, uten API-avhengighet, og helt on-premises. Kombinert med den lave RTF gjør dette TADA til et sterkt alternativ for bedrifter med privacy-krav.
Kilde: AI Advances / ai.gopubby.com
📬 Likte du denne?
AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.