发布时间:2025-01-21 13:30 原文链接: 国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

  1 月 20 日,国产 AI 大模型 DeepSeek 正式发布新版本 DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1 性能比肩 OpenAI o1 正式版。

image.png

DeepSeek-R1(蓝色条纹)与其他大模型的性能对比 来源:DeepSeek

  此外,开发团队在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。用户除了通过官网及 APP 使用新版本,还可以通过 API 接入模型,并获取思维链输出。


相关文章

白宫发布人工智能行动计划将减少监管并加快推动数据中心建设

当地时间周三,白宫发布了人工智能(AI)行动计划,提出了一揽子政策建议与产业举措,旨在巩固美国在AI领域的全球领导者地位。这一计划围绕三大支柱展开:加速创新、在美国本土构建AI基础设施,以及让美国硬件......

白宫发布人工智能行动计划将减少监管并加快推动数据中心建设

当地时间周三,白宫发布了人工智能(AI)行动计划,提出了一揽子政策建议与产业举措,旨在巩固美国在AI领域的全球领导者地位。这一计划围绕三大支柱展开:加速创新、在美国本土构建AI基础设施,以及让美国硬件......

刘强东阔气出手!两个月投了4家具身智能公司京东AI战略布局全面提速

许久不出手,一出手就是大手笔。7月21日,京东宣布完成三家具身智能领域头部企业的投资,分别为千寻智能、逐际动力(LimXDynamics)以及众擎机器人。这也是继5月参投智元机器人后,京东再次把关注点......

刘强东阔气出手!两个月投了4家具身智能公司京东AI战略布局全面提速

许久不出手,一出手就是大手笔。7月21日,京东宣布完成三家具身智能领域头部企业的投资,分别为千寻智能、逐际动力(LimXDynamics)以及众擎机器人。这也是继5月参投智元机器人后,京东再次把关注点......

日本开发出可预测卵巢功能的AI模型

日本东京大学日前发布新闻公报称,该校研究人员参与的团队成功开发出一款可预测卵巢功能的人工智能(AI)模型,能够通过简单的问诊和少量采血数据预测女性卵巢功能,有望为备孕和不孕症治疗提供支持。卵巢功能低下......

日本开发出可预测卵巢功能的AI模型

日本东京大学日前发布新闻公报称,该校研究人员参与的团队成功开发出一款可预测卵巢功能的人工智能(AI)模型,能够通过简单的问诊和少量采血数据预测女性卵巢功能,有望为备孕和不孕症治疗提供支持。卵巢功能低下......

AI学会“欺骗”,人类如何接招?

人工智能(AI)的迅猛发展正深刻改变着世界,但一些最先进的AI模型却开始表现出令人警惕的行为:它们不仅会精心编织谎言,谋划策略,甚至威胁创造者,以达到自己的目的。物理学家组织网在上个月一则报道中指出,......

AI学会“欺骗”,人类如何接招?

人工智能(AI)的迅猛发展正深刻改变着世界,但一些最先进的AI模型却开始表现出令人警惕的行为:它们不仅会精心编织谎言,谋划策略,甚至威胁创造者,以达到自己的目的。物理学家组织网在上个月一则报道中指出,......

北京协和医院研发AI系统破解眼底筛查难题

日前,记者从北京协和医院获悉,该院眼科主任医师陈有信领衔相关研究团队成功开发了基于超广角眼底影像(UWF)与深度学习技术的WARM人工智能系统,该系统可精准识别25种眼底疾病并智能生成转诊建议,为眼底......

北京协和医院研发AI系统破解眼底筛查难题

日前,记者从北京协和医院获悉,该院眼科主任医师陈有信领衔相关研究团队成功开发了基于超广角眼底影像(UWF)与深度学习技术的WARM人工智能系统,该系统可精准识别25种眼底疾病并智能生成转诊建议,为眼底......