Facebook 的母公司Meta Platforms今天发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。 Meta 声称,SeamlessM4T将与新的翻译数据集SeamlessAlign一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破。 (图片来源:网络) 该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的AI模型中分别进行翻译。SeamlessM4T支持: 近100种语言的语音识别。 近100种输入和输出语言的语音到文本翻译。 支持近100种输入语言和36种输出语言的语音到语音翻译。 支持近100种语言的文本到文本翻译。 支持近100种输入语言和35种输出语言的文本到语音翻译。 (图片来源:网络) 开发者声称:SeamlessM4T 建立在和其他人多年来在创建通用翻译器的过程中所取得的进步的基础上。去年,我们发布了No Language Left Behind (NLLB),这是一种支持200种语言的文本到文本机器翻译模型,并已作为翻译提供者之一并入维基百科。我们还分享了通用语音翻译器的演示,这是第一个针对闽南语(一种没有广泛使用的书写系统的语言)的直接语音到语音翻译系统。今年早些时候,我们发布了Massively Multilingual Speech,它提供了超过 1,100 种语言的语音识别、语言识别和语音合成技术。 (图片来源:网络) 值得一提的是,SeamlessM4T 借鉴了所有这些项目的研究成果,通过单一模型实现多语言和多模式翻译体验,该模型使用广泛的口语数据源构建,具有最先进的结果。 开发者扬言:这只是我们不断努力构建人工智能驱动的技术以帮助跨语言的人们联系的最新一步。未来,我们希望探索这一基础模型如何实现新的通信能力——最终让我们更接近一个每个人都能被理解的世界。 编辑点评:语言差异一直是全球交流和合作的一个挑战,而这种通用语言翻译技术的发展将为人们提供更多的机会去理解和沟通不同文化背景的人。这对于商务、旅游、教育、科研等领域都可能产生积极的影响。我认为 Meta Platforms 推出的 SeamlessM4T 对于促进全球交流和理解具有巨大的潜力。随着这种技术的不断发展和完善,我们可以期待更加无缝和智能的跨语言交流体验,让世界变得更加紧密和互联。 |
原创栏目
手机热点
手机视频
IT百科
网友评论
聚超值•精选