芯研所消息,Facebook母公司Meta近日发布自监督语音处理模型 XLS-R,共支持 128 种语言。

打开网易新闻 查看更多图片

据了解,这项技术可以让母语不同的人在元宇宙里社交。一位说着英语,一位说着汉语,两人可以靠XLS-R在元宇宙中进行无障碍对话。

目前,MetaAI已经在HuggingFace上发布了试用版语音直译模型,支持从22种语言转换到16种语言。此外官方还提供不同参数规模的语音识别模型,以及15种语言与英语之间的互译模型,供用户下载。

感兴趣的玩家可以点击下方链接进行体验。

传送门

官方博客:

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

GitHub 页:

https://github.com/pytorch/fairseq/tree/main/examples/wav2vec/xlsr

论文地址:

https://arxiv.org/abs/2111.09296v1

试用网页地址:

https://huggingface.co/spaces/facebook/XLS-R-2B-22-16