Meta的新人工智能可以翻译近100种语言的语音和文字

Meta's new AI can translate speech and text in nearly 100 languages.

Meta在周二推出了一种新的“全能”AI翻译模型,将其视为“创造通用翻译器的探索”的重要一步。

这个模型被称为SeamlessM4T,能够处理多种类型的翻译,包括文本到语音、语音到文本、语音到语音和文本到文本,涵盖近100种语言。与其他使用多个模型的语言翻译器不同,SeamlessM4T是一个单一系统,Meta表示这样能够“减少错误和延迟”,提高“翻译过程的效率和质量”。

SeamlessM4T是基于Meta先前的AI工作开发的。2022年7月,该公司推出了No Language Left Behind项目,使用AI进行200种语言的文本翻译,重点是改善对罕见或不常用语言的翻译。

该公司还发布了让您与具有个性的AI机器人聊天的模型,以及有关如何使用AI来组织您的Facebook和Instagram信息的更多信息。

与许多主要科技公司一样,Meta今年加大了开发和推出基于AI的工具和服务的重点。微软于2月发布了新的AI增强版Bing搜索,该搜索使用了OpenAI的ChatGPT的相同技术。亚马逊最近表示将使用生成式AI来分析和总结客户评价,而谷歌正在测试一种“重新构想在线搜索”的搜索生成体验。

AI几乎将颠覆每个行业领域,并已经融入了从健身到招聘的各个方面。在翻译领域,AI也用于像Google翻译应用程序这样的工具,以帮助增加结果的上下文。生成式AI的快速崛起也引发了对该技术风险和对社会的潜在影响的担忧。

与Meta以前的许多AI模型一样,SeamlessM4T以研究许可证的形式发布,以允许研究人员和开发人员在该技术的基础上进行开发。Meta还发布了该项目的元数据,命名为SeamlessAlign的数据集。Meta表示,这是最大的开源多模态数据集,包含了270,000小时的提取语音和文本对齐数据,用于训练其AI。

有关SeamlessM4T的更多技术信息,请查阅Meta的AI博客文章或该公司的研究Github页面。

编辑注:ENBLE正在使用AI引擎帮助创作一些故事。欲了解更多信息,请参阅本文。