Meta släpper öppen AI-modell som kan transkribera över 1600 språk

AI Analys
Nyheten handlar om framsteg och innovation inom AI-teknologi, vilket ger möjlighet att transkribera över 1600 språk och erbjuder öppen källkod för användning utan avgifter eller begränsningar.

Meta har nu släppt Omnilingual ASR, en ny AI-modell i öppen källkod för automatiserad taligenkänning som kan transkribera mer än 1600 språk, rapporterar Venture Beat. Detta kan jämföras med Open AI:s öppna Whisper-modell som stödjer enbart 99 språk. Genom tekniken “zero-shot in-context learning” kan modellen dessutom anpassas till tusentals fler språk utan omträning, genom att användaren bara matar in några exempel. I praktiken betyder det att över 5400 språk kan omfattas. Systemet är helt öppet och släpps under den fria Apache 2.0-licensen, vilket gör det möjligt för både forskare och företag att använda och bygga vidare på det utan avgifter eller begränsningar. Modellen består av flera delar, bland annat talrepresentationsmodeller och träningsdata för underrepresenterade språk. Omnilingual ASR är främst tänkt för tal-till-text-applikationer som röstassistenter, undertexter, arkivdigitalisering och bättre digitalt stöd för minoritetsspråk.

Gillade du denna positiva nyhet?

0