讯飞联手华为攻克全国产算力下推理模型训练难关
1月15日,科大讯飞发布了我国“全国产”算力平台第一个深度推理大模型——讯飞星火X1。据公开测试,该模型中文数学能力表现突出,目前已应用于教育、医疗等场景。在大模型研发领域,讯飞星火坚持走全国产化路线。据科大讯飞研究院副院长殷兵介绍,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的、具备深度思考和推理能力的大模型——讯飞星火X1。发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、美国数学邀请赛(AIME)赛题以及高中奥赛题的表现。讯飞星火X1对解题思路和步骤进行了详细拆解,准确给出了这些题目的答案。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。“讯飞星火X1充分展现深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否......阅读全文
智谱发布推理模型初代版本
12月31日,国内明星大模型创业公司北京智谱华章科技有限公司推出基于扩展强化学习技术训练的推理模型GLM-Zero-Preview,擅长处理数理逻辑、代码和需要深度推理的复杂问题。GLM-Zero-Preview是GLM-Zero的初代版本。智谱表示,目前的GLM-Zero-Preview与Open
讯飞联手华为攻克全国产算力下推理模型训练难关
1月15日,科大讯飞发布了我国“全国产”算力平台第一个深度推理大模型——讯飞星火X1。据公开测试,该模型中文数学能力表现突出,目前已应用于教育、医疗等场景。在大模型研发领域,讯飞星火坚持走全国产化路线。据科大讯飞研究院副院长殷兵介绍,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携
科大讯飞全国产深度推理模型星火X1实现升级
3月3日,记者从科大讯飞获悉,其自主研发的全国产深度推理大模型“星火X1”完成全面升级,并在医疗、教育等领域推出系列创新应用。科大讯飞表示,此次升级“充分证明基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的强大实力和持续创新的巨大潜力”。 在升级后的星火X1加持下,科大讯飞旗下讯飞晓
我国科学家提出高效推理策略-可避免大模型“过度思考”
随着人工智能大模型的不断发展,如何让其在“难”的问题上深入思考,而不是对所有问题“想个不停”?记者5月29日从中国科学院自动化研究所获悉,该所联合鹏城实验室提出了一种高效推理策略AutoThink,可让大模型实现自主切换思考模式,避免“过度思考”。 “当前,越来越多的大模型开始具备‘深度思考能
7所师范院校已部署上海师大教育大模型
截至1月10日,安徽师范大学、内蒙古师范大学等7所师范院校已完成“智·元课堂(MetaClass)”系统的部署,并正式进入试用阶段,另有21所境内外高校已签署或正在签署试用协议,目前正处于等候部署状态。MetaClass融合了符合学生认知特点的大语言推理模型、契合学生性格的行为模型以及适用于开放场景
手机就能跑!腾讯推出4款可端侧部署的开源模型
8月4日,腾讯混元宣布开源4款小尺寸模型,参数规模分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗端侧场景,且支持垂直领域低成本微调。据介绍,新开源的4个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思
智谱发布AutoGLM-2.0,给手机免费装上AI助理
去年10月,北京智谱华章科技有限公司(以下简称智谱)发布了首个手机应用产品——沉思(AutoGLM),开启人工智能助理(AI Agent)应用新时代。8月18日,智谱再次升级产品,发布AutoGLM 2.0。 AutoGLM 2.0 智谱供图 “每个人都可以免费使用AutoGLM 2.0。同
类脑信息处理研究取得进展
近期,中国科学院自动化研究所类脑智能研究中心类脑信息处理(BRAVE)研究组,在研究员张兆翔的带领下,在借鉴生物神经结构、认知机制与学习特性的神经网络建模与类人学习研究中取得了一系列突破性进展。该研究组在“视听模态的生成、融合”以及“智能体之间的知识迁移”取得了重大突破,系列成果发表在AAAI
OpenAI最新模型o3展现强大推理能力
12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进、近似人类的推理能力,在代码编写、数学竞赛和掌握人类博士级别的科学知识等方面,均超越了其“前辈”o1。 不过,英国《新科学家》网站在12月22
天气“哨兵”背后的新型机构,正在用AI驱动科研范式变革
近日,由上海科学智能研究院(下称上智院)与上海市气象局等联合研发的国内首个聚焦超大城市安全的AI气象预报模型“扶摇”正式亮相。 “扶摇”的空间分辨率达1公里,较传统模式提升3倍,推理速度从10分钟压缩至3秒,犹如为城市装上精准感知天气脉动的“数字神经”,更好地扮演起短时强降水、雷雨大风等中小尺
“具身智能已成为人工智能的下一个浪潮”
“具身智能旨在发展基于数据驱动的软硬件结合智能体,以不同形态的机器人在真实物理环境下执行任务为主要方式,来实现人工智能的进化,具备自感知、自认知、自决策、自执行、自学习等智能特征。”2024松山湖科学会议执行主席、中国工程院外籍院士张建伟表示,具身智能已成为人工智能的下一个浪潮。5月25日至26日,
《自然》发文盛赞中国开源AI模型DeepSeek
最近,由来自杭州的“深度求索”初创团队开发的DeepSeek系列AI模型,引发了全球范围的关注。1月24日,知名学术期刊《自然》也发文关注该模型及相应产品,称“中国开发的大语言模型DeepSeek-R1以亲民价格和开放性挑战了OpenAI的推理模型GPT-o1的地位,令科学家们感到兴奋”。《中国科学
推动生成式人工智能赋能产业发展
当前,我国生成式人工智能产业发展迅速,相关企业数量已经超过4500家。然而,生成式人工智能与实体经济融合的深度和广度仍有待提升,其巨大潜力尚未充分释放。究其原因,一方面在于生成式人工智能技术本身仍处于快速发展期,成熟度有待提高;另一方面,不同产业因其自身特性和发展阶段的差异,对生成式人工智能技术
TPU将成深度学习的未来?(二)
能够进行数据推理的第二代TPU第一代的TPU只能用于深度学习的第一阶段,而新版则能让神经网络对数据做出推论。谷歌大脑研究团队主管Jeff Dean表示:“我预计我们将更多的使用这些TPU来进行人工智能培训,让我们的实验周期变得更加快速。”“在设计第一代TPU产品的时候,我们已经建立了一个相对
可解释、可通用的下一代人工智能方法重大研究计划2025年度项目指南
可解释、可通用的下一代人工智能方法重大研究计划2025年度项目指南 可解释、可通用的下一代人工智能方法重大研究计划面向人工智能发展国家重大战略需求,以人工智能的基础科学问题为核心,发展人工智能新方法体系,促进我国人工智能基础研究和人才培养,支撑我国在新一轮国际科技竞争中的主导地位。 一、科学目标
《麻省理工科技评论》35位中国科技青年入选英雄榜!
《麻省理工科技评论》于 2016 年正式落地中国,次年,“35 岁以下科技创新 35 人” (Innovators Under 35)中国榜单正式发布!四年成长、四届榜单,我们持续关注和发掘中国科技发展中不断崛起的新兴力量。从实验室里最新的技术研发成果,到各前沿领域的科技创业者们所取得的里程碑式