Meta的ChatGPT竞争对手可能会让语言障碍成为过去

ChatGPT和GoogleBard等人工智能工具的兴起为多语言语音项目实现重大飞跃、推进语言技术和促进全球语言多样性提供了绝佳的机会。

Meta接受了这一挑战,推出了最新的AI语言模型,该模型能够识别并生成4,000多种口语语言的语音。

大规模多语言语音(MMS)项目意味着Meta的新人工智能不仅仅是ChatGPT的复制品。该模型使用非常规数据源来克服语言障碍,并允许个人用母语进行交流,而无需经过详尽的翻译过程。

最令人兴奋的是,Meta已将MMS开源,邀请研究人员学习并扩展其提供的基础。此举表明该公司在人工智能语言翻译领域的主导地位上投入了大量资金,同时也鼓励该领域的合作。

通常,语音识别和文本转语音人工智能程序需要对大量音频数据集进行大量训练,并结合细致的转录标签。在工业化国家之外发现的许多濒危语言缺乏像这样的庞大数据集,这使得这些语言面临消失或被排除在翻译工具之外的风险。

据Gizmochina报道,Meta对这个问题采取了一种有趣的方法,并深入研究了文本。这些文本提供了多样化的语言再现,使Meta能够对鲜为人知的语言进行“原始”和未开发的了解,以进行基于文本的研究。

MMS作为开源资源和研究项目的发布表明,Meta投入了大量时间和精力来解决技术领域缺乏语言多样性的问题,该领域通常仅限于最广泛使用的语言。

这是人工智能世界中令人兴奋的发展,它可以让我们更接近拥有目前只存在于科幻小说中的那种“通用翻译器”。想象一下,通过人工智能的力量,耳机不仅可以为你实时翻译外语,还可以过滤掉原始语言,这样你就只能听到自己的母语。

随着越来越多的研究人员使用Meta的彩信以及更多的语言,我们可以看到这样一个世界:辅助技术和文本转语音可以让我们与人们交谈,无论他们的母语是什么,从而更快地共享信息。作为一个试图自学语言的人,我对这一发展感到非常兴奋,因为它将使现实生活中的对话练习变得更加容易,并帮助贫民窟掌握只有母语人士才会知道的非正式和口语单词和短语。