自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。
神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是普遍可及的,这类语言被称为低资源语言。一味地增加模型翻译语言数量,可能会影响模型的翻译质量。
此次,Meta的法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力,实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具,名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。
由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。
研究团队指出,这个工具可以帮助很少被翻译的那些语言的使用者,让他们也能用上互联网和其他技术。此外,教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示,目前误译的情况仍有可能出现。
化学是一门研究物质组成、结构、性质与变化规律的学科,其发展史是人类突破自然表象、揭示物质本质的历史。从古代炼金术士对“点石成金”的痴迷,到现代科学家操控原子合成新物质,在好奇心的驱动下,人类正不断向着......
一、文件制订背景近年来,党中央、国务院高度重视人工智能发展,2025年8月国务院印发《关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号),要求探索推广人人可享的高水平居民健康助手,有序推......
国家卫生健康委办公厅、国家发展改革委办公厅等五部门发布关于促进和规范“人工智能+医疗卫生”应用发展的实施意见通知。国卫办规划发〔2025〕30号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、发展改......
10月31日,中国科学院第四届职工技能大赛人工智能领域比赛决赛在中国科学院自动化研究所成功举办。院直属机关党委常务副书记、院工会主席房自正,院直属机关党委副书记、院工会常务副主席杨旭,自动化研究所所长......
工业和信息化部党组书记、部长李乐成在《党建》杂志发表署名文章《加快推进人工智能赋能新型工业化》。文章指出,“面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导......
2025年世界科技与发展论坛虽已落下帷幕,“人工智能促进科技与发展”的主题仍在全球科技界激荡回响。在业界看来,这场论坛不仅展现了中国智造的技术硬实力,更清晰传递出一个核心信号:“开放合作”的包容姿态与......
近日,由中国科学技术协会主办的2025年世界科技与发展论坛在北京举行。作为中国科协“开放合作月”重要活动之一,本届论坛以“人工智能促进科技与发展”为主题,围绕人工智能与未来产业、开放科学与全球合作等四......
近日,记者从清华大学丘成桐数学科学中心获悉,该中心副教授周源与清华大学智能产业研究院、电子工程系副教授马剑竹合作,提出了一个可从观测数据中自动推导出空间物理规律的神经符号模型——PhyE2E(Phys......
关于发布新一代人工智能国家科技重大专项2025年度第一批项目申报指南的通知各有关单位:为加快实施新一代人工智能国家科技重大专项(以下简称“重大专项”),根据重大专项阶段性实施计划部署,现将2025年度......
2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......