发布时间:2024-05-02 11:43 原文链接: 大模型应用是否会复制“苹果时刻”

最近一两个月,不少哔哩哔哩(B站)用户发现,各种大模型使用教程视频越来越多了,智谱、Kimi Chat、文心一言、通义千问……业内人士表示,头部大模型厂商几乎已全部入局,仅在B站,品牌方的广告投入就是去年的3-4倍。

4月底,在发布日日新大模型5.0版后,商汤科技的股价一度上涨超过30%,当周股价涨幅近100%。与一年前发布会上“秀肌肉”不同,这次商汤科技把展示重点放在了大模型应用上,写代码、扩图、文生视频等功能获得好评。

当下大模型应用“你方唱罢我登场”的样子,颇有当年移动互联网崛起的影子。只不过从某种意义上说,直到2008年苹果推出App商店重新定义应用下载逻辑后,苹果手机才真正成为一款革命性产品。大模型应用是否也会复制这样一个“苹果时刻”,令人期待。

八成大模型应用可通过端侧解决

加载一个页面,人们愿意等待的极限时长是多久?研究数据表明,超过3秒,57%的人会离开。要想留住用户,必须守住“3秒定律”,大模型应用也不例外。

日前举行的商汤科技技术交流日活动上,商汤科技董事长兼CEO徐立演示了日日新大模型5.0版在扩图上的应用体验:让大模型根据一张图自由角度生成1200万像素及以上的高清图片,只需1.5秒。当日日新完成3张扩图后,另一款大模型才输出一张图。这番演示让现场自发响起一阵掌声。

日日新大模型5.0版在响应速度上的大幅领先,与其拥有端侧能力有关。徐立认为,今年是大模型在端侧应用的元年。所谓端侧,即包括手机、个人电脑、智能汽车等在内的终端产品,包含了大模型大部分的应用载体和场景。

与分布式计算同理,端侧大模型只需调用少部分资源就可输出用户想要的结果,而不像ChatGPT,每回答一个问题都要在其庞大的参数中“大海捞针”,能耗和成本非一般客户所能承担。

商汤科技很早就意识到要抓住端侧推动大模型应用落地。2022年9月,公司发布的自动驾驶UniAD就是一个端到端的大模型。一年后,特斯拉也明确其量产的智能车上将会安装端到端的大模型。

我国30亿台的手机市场是大模型厂商发力的另一个“端口”。商汤科技联合创始人、首席科学家王晓刚表示,未来手机上的模型一定是一个端云结合的模型,可能形成80%的大模型调用通过端上解决,少部分通过云端解决的格局。

所有学科都将拥有“AI研究员”

AI for Science(人工智能驱动的科学研究)是大模型应用的重要领域。继推出气象大模型风乌、科学大模型浦科化学之后,上海人工智能实验室最近又联合崖州湾国家实验室和中国农业大学发布了首个种业大语言模型丰登,填补了我国在AI育种领域的技术空白。

据介绍,这三个大模型都是在书生·浦语2.0强大的基座模型能力的基础上,针对不同的应用领域进行专业学科的知识训练,从而获得处理专业领域任务的能力。更有意思的是,由于书生·浦语2.0的逻辑推理能力大幅增强,三个垂类大模型都具备了一定程度的泛科学涌现能力,即学科间的融会贯通,成为具备“AI研究员”潜力的大模型。

“此前,科研人员往往需要跨越众多领域查阅文献、数据,才能找出不同现象之间的联系,现在可由大模型自主学习,发掘学科之间的复杂关联,从而生成新的知识结构。从某种意义上说,这类大模型可承担一部分研究员的工作。”上海人工智能实验室相关人员表示。

以浦科化学为例,研究人员发现,尽管没有对浦科化学进行数学和物理学科的训练,模型在大学数学、大学物理、STEM(科学、技术、工程和数学)等相关领域测试中也获得了最佳成绩,甚至在道德场景、人文科学、社会科学等分项任务上也展现出了优异的平均性能。

从长远看,所有学科都可以拥有自己的垂类大模型。当下,上海人工智能实验室AI for Science团队正面向化学、物理、生命、地球等科学领域,通过深入研究各学科基础理论,结合最新人工智能理论,加速AI在化学、药物研发、新材料、气象等领域的渗透与落地。

大模型正在追求“小赛道”

“ChatGPT引发百模大战时,我们一度以为大模型是大厂专属,但很快我们就发现这一轮大模型应用竞赛与移动互联网时代的竞争一样,需要许多行业的Know-how(默会知识)。”蜜度蜜巢总裁刘益东说。去年9月,蜜度蜜巢成为入驻全国首个大模型生态社区“模速空间”的首批企业之一。

从今年的市场发展来看,应用侧的“百模大战”比刘益东预想的来得更早。比如,长文本是当下打得最热的“赛点”,凭借一次能投喂两套《三体》三部曲的体量优势,月之暗面从国内一众AI大模型公司中脱颖而出,成为国内大模型“四小龙”之一。

尽管也有在长文本中实现“大海捞针”的能力,蜜度蜜巢仍选择从此前团队经营多年的政务领域切入大模型应用。比如,基于公司自研的蜜巢政务大模型应用“知知通”正在便民服务热线中辅助坐席快速作答。过去,话务员至少需要5分钟才能厘清电话那头的口语化表述和核心诉求,现在依托全面的数字知识库,客服仅需数秒即可从大段语音对话中抓取关键信息,5-10秒即可答复用户。

小厂的大模型应用追求“一招鲜”,大厂也在走向差异化。阿里云的通义千问、百度的文心一言、字节跳动的豆包这三款大模型App的定位分化已相当明显。其中,通义千问App不仅是一款大型预训练语言模型,更整合了创意文案、办公助理、学习助手、趣味生活等多个方面预设对话角色;豆包则精准定位语言对话模型,除了陪用户聊天对话外,它会主动给用户发消息以强化虚拟社交属性;文心一言通过多轮升级迭代后,当前已具有非常明显的平台属性。

在刘益东看来,大模型时代不会是某款明星应用包打天下,更可能是各个垂直细分领域都有个性化的行业解决方案,通过众多智能体高效协同协助人们完成某项事情。


相关文章

两款“坤元”大模型发布

7月29日,第三届海岸带大会在山东烟台召开。中国科学院地理科学与资源研究所研究员、“坤元”大模型首席科学家苏奋振发布了两款自主研发的大模型——“坤元·感东南”与“坤元·拟千海”。两款大模型分别针对陆和......

国内首个船海学科教育专有大模型上线

近日,由哈尔滨工程大学研发的国内首个船海学科教育专有大模型——“兴海”大模型,在国家高教智慧教育平台正式上线。“兴海”教育专有大模型以DeepSeek、文心一言、Kimi三大模型作为支撑。大模型由哈工......

全国首个慢性肾脏病综合管理大模型发布

5月18日,由国家肾脏病临床医学研究中心(南方医科大学南方医院)牵头研发的“慢性肾脏病综合管理大模型——智肾”在南方医科大学南方医院正式发布。同时宣布将赠送“智肾”大模型给贵州省人民医院、新疆医科大学......

《中医药大模型评测标准》发布

近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了......

大模型激活经济发展新动能

今年的政府工作报告提出,支持大模型广泛应用,并将其作为激发数字经济创新活力的核心举措之一。此举体现了我国对人工智能技术和数字经济发展的前瞻性布局,大模型成为带动千行百业生产力提升的新工具,更有望成为推......

国际首个符合国人特点的罕见病大模型进入临床

2月16日,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型正式进入临床应用阶段。据悉,该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据支撑,是国际首个符合中国人群特......

广东医科大学成功部署DeepSeekGDMU大模型

近日,广东医科大学健康医疗大数据工程中心携手华为技术团队共同打造的“DeepSeek-GDMU”大模型正式落地。记者获悉,“DeepSeek-GDMU”大模型是国内首个基于昇腾人工智能(AI)生态的医......

大模型安全治理:国际合作共筑AI发展新框架

“当前,人工智能技术以惊人的速度发展,如近期DeepSeek引领了低成本开发使用大模型的革新,这既为驱动新的创新提供了更多可能,也带来了诸多风险挑战,而在互联互通时代,加强国际合作至关重要。”2月11......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......

中国高校推出“元古大模型”助力地球科学研究

中新社武汉12月7日电(马芙蓉孙彦钦)由中国地质大学(武汉)与相关企业联合开发的“元古大模型”7日在武汉发布。该模型支持图生文、文生图、文生文等场景生成模式,验证了利用多模态大模型技术解决地球科学领域......