发布时间:2024-03-05 09:18 原文链接: 一夜易主——全球最强大模型由GPT4进入Claude3时代

Anthropic公司发布了最新的Claude 3系列模型,一举击败了全球最强AI模型GPT-4。Claude 3在多模态和语言能力等指标上表现出色,树立了新的行业基准。

Claude 3系列包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,能力逐级增强。Opus作为最先进模型,在多项评估标准上领先同行,展现出几乎与人类相媲美的理解和表达能力,是AGI领域的领跑者。Claude 3在分析预测、代码生成、多语言理解和视觉识别等方面实现了显著进步。Opus在处理复杂任务时表现出色,Sonnet在速度和计算效率上找到平衡,Haiku则具备快速响应的优势。Claude 3 Opus在多项基准测试中完胜GPT-4和Gemini 1.0 Ultra,Sonnet也在部分基准上超越GPT-4。Opus在LSAT、MBE、数学竞赛等考试中表现出色,展示出高智能水平。

全球最强LLM易主

Opus,是Claude 3系列中最先进的模型。

它在多项AI系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界LLM的性能。

尤其是,Opus在处理复杂任务时,展现了几乎与人类相媲美的理解和表达能力,是AGI领域的领跑者。

Claude 3系列模型在分析预测、创建细微内容、代码生成,以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。

最小规模,3秒读完10k token论文

Claude 3系列模型能够支持实时用户交流、自动完成和数据提取等任务(需要立即且实时的反馈)。

在同类智能模型中,Haiku以其卓越的速度和成本效益成为市场上的佼佼者。

Haiku可以在不到3秒时间,阅读一个包含图表和图形的信息和数据密集型的研究论文(大约10k token)。

多模态视觉能力

另外,值得一提的是,Claude 3系列模型具备与其他领先模型相媲美的高级视觉识别能力。

它们能够处理各种视觉格式,包括照片、图表、图形和技术绘图等。


相关文章

全球首个耐火材料垂直领域大模型“祝融”上线

轻点鼠标,登录系统,在对话框中输入“镁碳砖抗热震性优化方案”,仅需几秒钟,一份逻辑严密、数据翔实的分析报告便自动生成。近日,全球首个耐火材料垂直领域大模型“祝融·耐火智工”上线试用,该模型由武汉科技大......

两款“坤元”大模型发布

7月29日,第三届海岸带大会在山东烟台召开。中国科学院地理科学与资源研究所研究员、“坤元”大模型首席科学家苏奋振发布了两款自主研发的大模型——“坤元·感东南”与“坤元·拟千海”。两款大模型分别针对陆和......

国内首个船海学科教育专有大模型上线

近日,由哈尔滨工程大学研发的国内首个船海学科教育专有大模型——“兴海”大模型,在国家高教智慧教育平台正式上线。“兴海”教育专有大模型以DeepSeek、文心一言、Kimi三大模型作为支撑。大模型由哈工......

全国首个慢性肾脏病综合管理大模型发布

5月18日,由国家肾脏病临床医学研究中心(南方医科大学南方医院)牵头研发的“慢性肾脏病综合管理大模型——智肾”在南方医科大学南方医院正式发布。同时宣布将赠送“智肾”大模型给贵州省人民医院、新疆医科大学......

《中医药大模型评测标准》发布

近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了......

大模型激活经济发展新动能

今年的政府工作报告提出,支持大模型广泛应用,并将其作为激发数字经济创新活力的核心举措之一。此举体现了我国对人工智能技术和数字经济发展的前瞻性布局,大模型成为带动千行百业生产力提升的新工具,更有望成为推......

国际首个符合国人特点的罕见病大模型进入临床

2月16日,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型正式进入临床应用阶段。据悉,该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据支撑,是国际首个符合中国人群特......

广东医科大学成功部署DeepSeekGDMU大模型

近日,广东医科大学健康医疗大数据工程中心携手华为技术团队共同打造的“DeepSeek-GDMU”大模型正式落地。记者获悉,“DeepSeek-GDMU”大模型是国内首个基于昇腾人工智能(AI)生态的医......

大模型安全治理:国际合作共筑AI发展新框架

“当前,人工智能技术以惊人的速度发展,如近期DeepSeek引领了低成本开发使用大模型的革新,这既为驱动新的创新提供了更多可能,也带来了诸多风险挑战,而在互联互通时代,加强国际合作至关重要。”2月11......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......