Mistral släpper AI-talmodell i öppen källkod

AI Analys
Nyhetsartikeln handlar om ett framsteg inom AI och teknik, där det franska bolaget Mistral AI har släppt en ny öppen källkodsmodell för text-till-tal. Modellen Voxtral TTS erbjuder avancerade funktioner som stöd för flera språk, anpassad röstskapande på kort tid och bibehållande av röstens egenskaper vid språkväxling. Detta bidrar till innovation inom röstteknologi och öppnar upp för nya användningsområden.

Detaljerad Analys

Ämnen:
teknik vetenskap
Känsla:
hoppfull inspirerande
Nyckelord:
AI teknologisk innovation språkstöd
Varför är detta positivt?
  • främjar teknologisk utveckling
  • möjliggör anpassade röster för olika ändamål
Omfattning: global

Det franska AI-bolaget Mistral AI har lanserat en ny öppen källkodsmodell för text-till-tal, Voxtral TTS, som är tänkt för både röstassistenter och företagsanvändning som kundsupport och försäljning. Modellen stödjer nio språk (bland annat engelska, franska, tyska och arabiska) och kan skapa en anpassad röst från mindre än fem sekunders ljud. Den kan dessutom behålla röstens egenskaper, som accent och tonfall, även när den växlar mellan språk, vilket gör den användbar för exempelvis dubbning och realtidsöversättning. Latensen ska dessutom vara låg och levererar ljudet på bara 90 millisekunder. – Våra kunder har efterfrågat en talmodell. Så vi byggde en liten talmodell som kan köras på en smartklocka, en smartphone, en laptop eller andra edge-enheter. Kostnaden är en bråkdel av vad annat på marknaden kostar, men den levererar prestanda i världsklass, säger Pierre Stock, vice vd för science operations på Mistral AI, till Techcrunch.

Läs hela artikeln hos Computer Sweden

Gillade du denna nyhet?

0