200亿A股出手!布局大规模算力集群
10月24日,协创数据表示,因规划建设具备大模型训练和推理能力的大型算力服务集群(万卡级),将采购GPU服务器,包括H20 NVLINK型AI GPU服务器,预计采购金额不超过9亿元。 值得注意的是,协创数据此次再度加码算力服务器业务,旨在推出万卡级别的计算集群。通过万卡集群来为大模型提供更高算力虽然已成为业内共识,但能设计并有效运行万卡集群的企业仍为少数。加码算力服务器业务 10月24日,协创数据发布公告称,因规划建设具备大模型训练和推理能力的大型算力服务集群(万卡级),公司间接控股的子公司广州奥佳软件技术有限公司与上海域允信息技术有限公司签署《采购框架合同》,向其采购GPU服务器,包括H20 NVLINK型AI GPU服务器,预计采购金额不超过9亿元。 协创数据表示,本合同有利于公司云服务业务开展,进一步提升公司的市场竞争力,从而更好地满足市场对公司产品及算力服务的需求,增强公司整体实力,预计将对公司未来的经营业绩......阅读全文
200亿A股出手!布局大规模算力集群
10月24日,协创数据表示,因规划建设具备大模型训练和推理能力的大型算力服务集群(万卡级),将采购GPU服务器,包括H20 NVLINK型AI GPU服务器,预计采购金额不超过9亿元。 值得注意的是,协创数据此次再度加码算力服务器业务,旨在推出万卡级别的计算集群。通过万卡集群来为大模型提供更高
新引擎实现大语言模型推理速度显著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
OpenAI打包新闻集团版权训练大模型
ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP
OpenAI-发布新一代大模型,更擅长推理也更贵
传说中的“草莓”现身,9月12日晚间,OpenAI正式对外发布一款名为o1的新模型,这款模型为该公司下一代 “推理” 模型中的第一个,o为“Orion(猎户座)”,这款模型可以比人类更快地回答更复杂的问题。与以前的模型相比,在编写代码和解决多步骤问题方面做得更好。但它也比此前发布的GPT-4o更贵,
全国首个DNA存储领域预训练大模型“ChatDNA”发布
近年来,DNA 和人工智能一直都是科技发展的热门议题。随着科学技术的进步,它们之间便有了无限的可能性。例如,DNA 和人工智能可以帮助我们更快地研究特定基因组的变异和功能。科学家可以使用人工智能算法来分析大量的 DNA 序列,从而发现有价值的变异和基因功能,为疾病的治疗提供线索。DNA 是生物世界中
大模型训练遇“算力荒”,“超智融合”来帮忙
论及当下计算技术的发展方向和趋势,“超智融合”当仁不让——在今年6月发布的2024年全球“最节能超算”榜单(Green500)上,位列榜单前三的超算都采用了“超智融合”的技术理念。超智融合,顾名思义,意即“采用融合架构,集成超算和智算的功能”。在当前大模型训练不断需要大算力支持的时代背景下,超智融合
高文:将训练大模型底座面向全社会开放
·高文表示,开发大模型不是拍脑袋、喊口号那么容易,而是必须拥有算力,只有投入几十亿元甚至上百亿元才能做出“像样的东西”,但这笔资金对于高校和初创企业而言是一个门槛。“我们基本的想法就是用鹏城实验室的算力、公开渠道的数据,训练出大模型底座面向全社会开放,供研究人员、创业者使用。”5月22日,中国工程院
OpenAI推出具备推理能力新AI模型
据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的
OpenAI推出具备推理能力新AI模型
据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的
面向跨模态遥感数据的生成式预训练大模型发布
以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中
预训练模型创业渐入佳境
2月10日,创新工场在京宣布,北京澜舟科技公司已完成近亿元Pre-A轮融资,此次融资由联想创投、斯道资本共同领投,创新工场跟投。本轮融资澜舟科技将主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。澜舟科技的新一轮融资,是时下围绕人工智能预训练大模型的创新创业渐入佳境的生动体现。在澜舟科技创始
学术论文正被高价出售给大模型训练,作者却零收入
·越来越多的学术出版商正将研究论文卖给科技公司用以训练人工智能(AI)模型,而作者收入为零。大语言模型(LLM)因训练数据问题再次引发争议。日前,国际著名期刊《自然》(《Nature》)杂志编辑伊丽莎白·吉普尼(Elizabeth Gibney)发布一篇题为《你的论文被用来训练人工智能模型了吗?几乎
科学家在大模型少样本域适应方面取得进展
近日,中国科学院软件研究所天基综合信息系统全国重点实验室研究团队提出了一种新颖的提示学习方法BayesPrompt,该方法通过探索以去偏方式近似下游任务的完整训练域,为预训练语言模型提供去歧义指导。相关论文被机器学习领域顶级学术会议ICLR 2024接收。研究人员认为,学习范式长期存在的问题之一是下
学者发布无机材料AI模型,推理能力到达新高度
松山湖材料实验室研究员孟胜/刘淼团队在国家自然科学基金等项目的支持下,研发了一种基于深度学习图结构的通用预训练力场(graph-based pre-trained transformer force field,简称GPTFF)。相关成果近日发表于《科学通报(英文版)》(Science Bullet
青年科学家:尺度定律不能显著提高模型因果推理能力
幻觉和泛化是模型落地绕不开的话题。模型的幻觉带来错误回答,使得人们在一些关键的认知上产生疑虑,一定程度上会阻碍大模型落地。由于过分注重尺度定律,人力、算力等大量资源资源投入到尺度定律,导致基层研究人员没有足够多的计算资源研究新的模型路线,挤压创新空间。青年科学家共同探讨大模型技术架构的未来可能性人工
2023年“双创领航精英训练营”启动
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/506148.shtm8月4日上午,2023年教育部内地与港澳高等学校师生交流计划暨“双创领航精英训练营”在深圳大学启动。本届训练营由深圳大学和香港理工大学共同成立的大湾区国际创新学院、深圳大学创新创业教育
网宿科技:边缘计算将在大模型时代迎来更多用武之地
近日,在全球边缘计算大会上,网宿科技携网宿边缘智能平台重磅亮相,并分享了网宿边缘计算对于大模型时代的思考与探索。 网宿科技边缘智能平台资深架构师陈云辉表示,在未来大模型将成为一种基础设施,每个行业甚至每个企业都会有属于自己的大模型。而如何更好地将大模型落地到具体应用场景、提升生产力,是产业共同
直面大模型“大成本”挑战,如何提高算力效率?
近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力代价、能源代价同样巨大。有业界技术团队测算,若要对一个5000亿参数规模的单体大模型进行充分训练,所
用AI生成数据训练AI或导致模型崩溃
科技日报北京7月25日电 (记者张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野
用AI生成数据训练AI或导致模型崩溃
《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练
面对大模型应用门槛高-如何大模型发挥更大价值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?
百度CTO干货演讲,一文看懂飞桨和文心大模型
作为AI工业大生产的基础平台,深度学习平台下接芯片、上承应用,被视为“智能时代的操作系统”。作为我国首个自主研发的产业级深度学习开源开放平台,飞桨致力于解决深度学习技术发展和大规模产业化中的诸多难题,降低AI开发和应用的门槛,助力AI普惠。 6月9日晚,北京信息科学与技术国家研究中心系列交
OpenAI开发神秘项目“草莓”提升模型智能
·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报
《自然》封面:以AI生成数据训练AI,模型变傻?
大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡言乱语”
《自然》封面:以AI生成数据训练AI,模型变傻?
大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”—— 近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡
空天院等推出遥感智能训推一体机
近日,中国科学院空天信息创新研究院赛博智能团队基于自研的遥感智能解译基础模型,联合中科边缘智慧信息科技(苏州)有限公司,共同发布“空天·灵犀”遥感智能训推一体机,突破了基础模型轻量化等关键技术,实现了遥感基础模型的高时效灵活部署,提供了数据、模型、平台、硬件一体化的解决方案。 随着空天信息和人
华为徐直军:每个企业都要思考获取AI能力的方式
“一段时间以来,各行各业几乎言必称大模型,纷纷建设人工智能(AI)算力、训练大模型,这对于华为这样的算力提供商而言无疑是重大利好。”9月19日,在2024年华为全联接大会上,华为副董事长、轮值董事长徐直军在主题演讲中直言,但从长远来看,不是每个企业都要建设大规模的AI算力、训练基础大模型,不是所有的
GPT4o为OpenAI开启超级入口
·基于ChatGPT或GPT-4o,未来人类获得信息的方式很可能会改变,GPT-4o或为OpenAI开启了一个超级入口,这可能会对谷歌带来影响。接下来,OpenAI需要判断的是在产品上的极致体验是否是刚需。“GPT-4o在交互模式上是一个巨大进步。”5月14日,蚂蚁集团副总裁、NextEvo负责人徐
AI芯片引领未来-云天励飞闪耀2023世界人工智能大会
2023世界人工智能大会将于7月6日至8日在上海举办。本次大会上,云天励飞展示了自主设计开发的新一代边缘计算芯片 Deep Edge10 系列 SoC 芯片,并公布“天书”大模型的最新动态。 大模型与芯片全面亮相 本次世界人工智能大会上,云天励飞展示了新一代边缘计算芯片 Deep Edge1
百度CTO王海峰揭秘文心一言背后的AI技术
3月16日,百度在北京总部召开新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰出席,李彦宏展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力,王海峰解读了文心一言的技术特性及其背后的技术积累。王海峰 百度供