12月8日,鹏城实验室与百度联合发布全球首个知识增强千亿大模型——鹏城—百度·文心。
为什么大模型在产学界持续走热,越来越多的技术公司入场?
如中国工程院院士、鹏城实验室主任高文所言,预训练模型赋能人工智能衍生更多的应用,而不局限于某个领域,是人工智能自身发展并作用于社会及科学创新的重要工具。
当人工智能的需求呈现出碎片化、多样化的特点,人工智能模型却存在很多挑战,通用性低是首要问题。也就是说,A模型往往专用于特定A领域,应用到B领域便差强人意。
百度首席技术官王海峰介绍,鹏城—百度·文心是全球首个知识增强千亿大模型,参数规模达2600亿。在机器阅读理解、文本分类、语义相似度计算等60多项任务上取得最好效果,并在30余项小样本和零样本任务上刷新基准。
百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜说:“60多项不同的任务,说明大模型的通用性很强,30余项小样本和零样本任务刷新基准,则意味着大模型泛化能力更强,对支撑各行各业非常重要。”
鹏城—百度·文心希望解决传统人工智能模型泛化性差、强依赖昂贵人工标注数据、落地成本高等应用问题,希望成为千行百业人工智能开发的首选基座大模型。
而鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台就是鹏城—百度·文心理想实现的关键支撑,解决了超大模型训练的多个公认技术难题。
作为产业级知识增强大模型,文心包含自然语言理解大模型、计算机视觉大模型和跨模态大模型,既指向基础通用的,也面向重点领域和重点任务,还有丰富的工具与平台。“知识增强”是它的核心特色。
知识是人类智慧的结晶,是人类进步的重要推动力。通过知识增强,计算机有了学习并运用知识,像人一样理解和认知世界的可能。
吴甜强调:“我们希望人工智能系统通过对知识的学习,能够提升学习效率,具有更好的可解释性,更符合人对事物的理解。”
文心大模型正通过百度飞桨平台陆续对外开源开放,已大规模应用于百度搜索、信息流、智能音箱等互联网产品,并赋能工业、能源、金融、通信、媒体、教育等各行业。
6月28日,国家能源集团在京举行发布会,正式发布全球首个千亿级发电行业大模型——“擎源”。该模型构建了覆盖安全环保、电力交易、产调中枢、设备检修全链条的智能决策体系,实现电力全场景智慧化升级、模型自主......
近日,中国首个海洋领域开源大模型OceanGPT(沧渊)在杭州正式发布。该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模......
近日,中国热带农业科学院南亚热带作物研究所旱作农业工程团队在基于混合监督学习的菠萝智能识别算法方面取得新进展。该团队设计了一个基于混合监督学习(MIset)的掩蔽自关注实例分割网络,以快速提取菠萝的位......
近日,首个可精准诊断罕见病的医学影像多模态大模型矩阵“明岐”正式亮相。当天,由上海交通大学主办,上海交通大学计算机学院(网络空间安全学院)、上海交通大学国际与公共事务学院、健康长三角研究院共同承办的“......
国家药监局药审中心关于发布《模型引导的创新药物剂量探索和优化技术指导原则》的通告(2024年第53号)。为推动创新药物高质量发展,进一步指导我国创新药物临床试验阶段剂量探索和优化,药审中心组织制定了《......
据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在HuggingFace平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企......
被称为是“未来已来”和“无所不能”的人工智能(AI)技术,通过迅猛发展和广泛应用,正影响着人类生活与工作的方方面面,其未来发展趋势广受关注。2024年世界科技与发展论坛“人工智能治理创新为培育科技治理......
未来的中央处理器(艺术图)。图片来源:美国趣味工程网站科技日报讯 (记者刘霞)据美国趣味工程网站近日报道,日本东北大学和美国麻省理工学院科学家,成功开发出一款新人工智能(AI)模型GNNOp......
“一段时间以来,各行各业几乎言必称大模型,纷纷建设人工智能(AI)算力、训练大模型,这对于华为这样的算力提供商而言无疑是重大利好。”9月19日,在2024年华为全联接大会上,华为副董事长、轮值董事长徐......
中国科学院地理科学与资源研究所于9月19日在北京举行新闻发布会,正式发布全球首个多模态地理科学大模型“坤元”(SigmaGeography),旨在推动地理学与人工智能深度融合。该大模型是专注于地理科学......