行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。
用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示,国内公开发布的大模型已达80多个。我们是否需要这么多大模型?这场热潮会持续多久?会不会带来泡沫?对此我们还需多一些冷思考。
国内企业纷纷入局大模型,是因为看好大模型背后的商业价值。虽然被众人调侃为“一本正经地胡说八道”,但在ChatGPT展现了其在聊天对话、创作编程等方面模拟人类思维的智能之后,业界对于人工智能的认知和想象又打开了新空间。一些企业将大模型视为人工智能的核心,认为这很可能是引领第四次工业革命的颠覆性创新技术,将推动各个行业的变革。能抓住这样的超级风口既是企业实力的象征,也更容易获得资本的青睐。正因为如此,短短几个月,国内人工智能大模型数量呈现爆发式增长。
大模型并非多多益善。以ChatGPT为代表的通用大模型,技术门槛高,开发、训练、运营等成本耗资巨大,动辄一次训练成本就高达数百万美元,被称为“少数人的豪华游戏”。只有大型龙头企业或领军企业才具备相应的研发和投资实力,其他企业盲目跟风、一哄而上不仅很难成功,还会带来投资浪费,增加能源、算力等消耗,产生低质量产品。简而言之,推出多个通用大模型既不现实,也没有那么多市场需求,还会带来同质化竞争。
产业界现在越发关注行业大模型,其门槛大大低于通用大模型,所需投入成本相对更低。但也要看到,写诗作画绝非大模型的全部,行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。当前,已有一些行业大模型在金融、制造、医药研发、煤矿、铁路等诸多领域发挥了作用。
当前,大模型发展还处于初期,仍面临技术短板、隐私安全等问题。在一些大模型的实际使用过程中,已被发现生成内容存在质量不佳、冗余回答等问题,甚至有输出危害内容的风险。为此,国家互联网信息办公室等7部门日前联合公布《生成式人工智能服务管理暂行办法》,对生成式人工智能产品及服务提供者作出了一定要求和规范,但目前尚缺乏对使用者的有力约束。
此外,大模型生成内容的知识产权、数据来源的合法性等问题都亟待解决。还需统筹资源,加快基础研究和技术创新,强化场景牵引作用,建立健全大模型监管机制,加强国际合作与交流。
一项新兴产业的发展初期,难免会有一定的泡沫和过剩。但要避免过度,因为泡沫定会挤掉,市场总会洗牌。当热潮退去,大浪淘沙之后,能留下的注定是脚踏实地的赢家。
7月29日,第三届海岸带大会在山东烟台召开。中国科学院地理科学与资源研究所研究员、“坤元”大模型首席科学家苏奋振发布了两款自主研发的大模型——“坤元·感东南”与“坤元·拟千海”。两款大模型分别针对陆和......
近日,由哈尔滨工程大学研发的国内首个船海学科教育专有大模型——“兴海”大模型,在国家高教智慧教育平台正式上线。“兴海”教育专有大模型以DeepSeek、文心一言、Kimi三大模型作为支撑。大模型由哈工......
5月18日,由国家肾脏病临床医学研究中心(南方医科大学南方医院)牵头研发的“慢性肾脏病综合管理大模型——智肾”在南方医科大学南方医院正式发布。同时宣布将赠送“智肾”大模型给贵州省人民医院、新疆医科大学......
近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了......
今年的政府工作报告提出,支持大模型广泛应用,并将其作为激发数字经济创新活力的核心举措之一。此举体现了我国对人工智能技术和数字经济发展的前瞻性布局,大模型成为带动千行百业生产力提升的新工具,更有望成为推......
2月16日,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型正式进入临床应用阶段。据悉,该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据支撑,是国际首个符合中国人群特......
近日,广东医科大学健康医疗大数据工程中心携手华为技术团队共同打造的“DeepSeek-GDMU”大模型正式落地。记者获悉,“DeepSeek-GDMU”大模型是国内首个基于昇腾人工智能(AI)生态的医......
“当前,人工智能技术以惊人的速度发展,如近期DeepSeek引领了低成本开发使用大模型的革新,这既为驱动新的创新提供了更多可能,也带来了诸多风险挑战,而在互联互通时代,加强国际合作至关重要。”2月11......
1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......
中新社武汉12月7日电(马芙蓉孙彦钦)由中国地质大学(武汉)与相关企业联合开发的“元古大模型”7日在武汉发布。该模型支持图生文、文生图、文生文等场景生成模式,验证了利用多模态大模型技术解决地球科学领域......