发布时间:2024-06-06 12:08 原文链接: 神经机器模型能翻译200种语言

科技日报北京6月5日电 (记者张梦然)《自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。

神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是普遍可及的,这类语言被称为低资源语言。一味地增加模型翻译语言数量,可能会影响模型的翻译质量。

此次,Meta的法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力,实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具,名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。

由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。

研究团队指出,这个工具可以帮助很少被翻译的那些语言的使用者,让他们也能用上互联网和其他技术。此外,教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示,目前误译的情况仍有可能出现。

 


相关文章

诺奖得主接受《中国科学报》专访,透露三个成功秘诀

10月14日,2024国际光化学技术与产业大会在武汉开幕。参加会议的2021年诺贝尔化学奖获得者、德国马克斯·普朗克煤炭研究所教授本杰明·李斯特(BenjaminList),在会议期间接受了《中国科学......

马斯克直播爆猛料机器人工作能力将超越人类70%

在最新的直播中,马斯克一如既往的语出惊人,透露了特斯拉的许多重大信息。第一,马斯克承认了他的AI大模型Grok要集成到特斯拉汽车上,这可以说是特斯拉车型机器人最重要的一步。Grok相当于给这些车型机器......

马斯克直播爆猛料机器人工作能力将超越人类70%

在最新的直播中,马斯克一如既往的语出惊人,透露了特斯拉的许多重大信息。第一,马斯克承认了他的AI大模型Grok要集成到特斯拉汽车上,这可以说是特斯拉车型机器人最重要的一步。Grok相当于给这些车型机器......

创新AI技术,科学家发现迄今距其主星最近的最小行星

近日,由中国科学院上海天文台葛健教授带领的国际团队,创新了一种深度学习算法,成功在开普勒卫星2017年释放的恒星测光数据中发现了五颗直径小于地球、轨道周期短于1天的超短周期行星,其中四颗是迄今为止发现......

创新AI技术,科学家发现迄今距其主星最近的最小行星

近日,由中国科学院上海天文台葛健教授带领的国际团队,创新了一种深度学习算法,成功在开普勒卫星2017年释放的恒星测光数据中发现了五颗直径小于地球、轨道周期短于1天的超短周期行星,其中四颗是迄今为止发现......

AI会威胁人类?“教父们”也有分歧:Meta首席科学家称完全是胡说八道

Meta首席人工智能科学家、有“AI教父”之称的杨立昆(YannLeCun)似乎并不不担心人工智能会对人类构成威胁。他在接受最新采访时详细阐述了自己的观点,并在回答有关AI是否聪明到足以对人类构成威胁......

AI会威胁人类?“教父们”也有分歧:Meta首席科学家称完全是胡说八道

Meta首席人工智能科学家、有“AI教父”之称的杨立昆(YannLeCun)似乎并不不担心人工智能会对人类构成威胁。他在接受最新采访时详细阐述了自己的观点,并在回答有关AI是否聪明到足以对人类构成威胁......

AI会威胁人类?“教父们”也有分歧:Meta首席科学家称完全是胡说八道

Meta首席人工智能科学家、有“AI教父”之称的杨立昆(YannLeCun)似乎并不不担心人工智能会对人类构成威胁。他在接受最新采访时详细阐述了自己的观点,并在回答有关AI是否聪明到足以对人类构成威胁......

工业和信息化部与北京市召开推动人工智能赋能新型工业化座谈会

2024年10月10日,深化部市合作推动人工智能赋能新型工业化座谈会在京召开,北京市委书记尹力,工业和信息化部党组书记、部长金壮龙,北京市委副书记、市长殷勇讲话。工业和信息化部党组成员、副部长单忠德,......

复旦教授马剑鹏:AI已绕不开,宜从娃娃抓起

“我整个职业生涯一直在做这个东西,但心里很清楚,同行也这么认为——在我们有生之年,‘蛋白质的折叠’问题是不可能解决的,尤其是蛋白质结构预测问题。结果AlphaFold出来了!”10月9日,博士生导师、......