直面大模型“大成本”挑战,如何提高算力效率?
近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力代价、能源代价同样巨大。有业界技术团队测算,若要对一个5000亿参数规模的单体大模型进行充分训练,所需算力基础设施约在10亿美元规模,每年消耗的电费在5.3亿元人民币。无论对于哪个机构、企业,这都是天文数字和巨大代价,中国也不例外。知名科学杂志《Nature》此前发表了一篇关于大模型未来发展之路的文章,《In Al, is bigger always better?》(人工智能,越大型越好?)。争议的出现,意味着AI发展方向出现了分歧。如今,“大”不再是模型的唯一追求,计算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(......阅读全文
李彦宏:中国的大模型太多,AI原生应用太少
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512462.shtm“中国的大模型很多,但是基于大模型开发出来的AI原生应用却非常少。”11月15日,在与第25届高交会同期举办的深圳2023西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏谈及国内A
2023AI遥感大模型产业峰会即将在武汉召开
原文地址:http://news.sciencenet.cn/htmlnews/2023/7/505131.shtm
大模型让全球“黑客”狂欢!AI安全向何处去?
对网络安全而言,每一次新的信息技术浪潮都蕴含着巨大机会,同时也意味着巨大的挑战。这是因为,新技术必然带来新的安全问题和新的需求,而“黑客”往往能快一步利用新的漏洞并发起攻击,“防守方”则需要更快的响应和改变。大模型技术亦如此。近日,在主题为“安全AI未来”的“C3安全大会·2024”上,亚信安全亚信
“AI+教育”,复旦推出大语言模型助力新生报到
8月25日,是复旦大学本科生新生报到的日子。来自全国各地和全球40多个国家的4300余名2024级本科新生,开启了在复旦的求学生涯。新生报道现场。为帮助来自世界各地的新同学尽快融入复旦大学,学校基于大语言模型,推出“复旦迎新助手”智能Agent。作为新生的贴心小帮手,大语言模型为新同学在迎新阶段提供
AI大模型,智能汽车的下一个战场?
ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面。前两个月,百度、阿里、腾讯加入;进入5月份,先有网易有道,发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品;后有科大讯飞,发布认知大模型“讯飞星火”……总之,各种大大小小的发布
智谱AI发布国产大模型商业化案例合集
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519107.shtm热议一年有余的人工智能(AI)大模型到底能帮人们做什么?3月14日,在智谱AI举办的一场小型媒体沟通会上,智谱AI首席执行官张鹏发布了智谱大模型商业化案例合集。该案例合集涵盖了传媒、咨
中山医院发布首个心血管专科AI大模型
“我们能教会AI像顶尖专家一样思考。”中国科学院院士、复旦大学附属中山医院(以下简称中山医院)内科主任葛均波表示。2月26日,由中山医院联合上海科学智能研究院共同研发的“AI心医生”——观心大模型CardioMind beta版(以下简称CardioMind)正式发布。作为国内首个深耕心血管专科的医
AI视频生成模型Sora来了
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm
AI模型助力精准诊断冠心病
近日,由上海市第一人民医院与联影智能的一项研究开发并验证一款可自动量化心肌血流状况的CT心肌灌注成像深度学习模型,辅助医生准确诊断患者心肌缺血程度,其衍生的缺血心肌体积百分比指数可作为预测不良心血管事件(以下简称MACE)发生概率的重要参考,能帮助医生预判患者发病几率,进而制定个性化治疗方案。相关论
人工智能框架生态峰会掀开AI大模型新篇章
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502804.shtm
大模型安全治理:国际合作共筑AI发展新框架
“当前,人工智能技术以惊人的速度发展,如近期DeepSeek引领了低成本开发使用大模型的革新,这既为驱动新的创新提供了更多可能,也带来了诸多风险挑战,而在互联互通时代,加强国际合作至关重要。”2月11日,在“人工智能技术及其应用进展”专题边会上,清华大学交叉信息研究院、人工智能学院院长姚期智提到
iPhone或将接入国产AI大模型-半导体设备借势腾飞
19日午后,受消息面刺激 AI + 概念集体拉升,半导体设备受提振翻红大涨。据悉,苹果公司正与腾讯和字节跳动商谈将二者的人工智能模型整合到在中国销售的 iPhone 中,此消息引发广泛关注。目前,苹果与腾讯和字节就使用二者人工智能模型的讨论还处于非常早期的阶段。这一动态使得市场对科技融合的未来充满期
Keep与OPPO达成战略合作-涉及硬件、AI大模型等领域
1月15日,Keep宣布与与OPPO达成了战略合作。Keep表示,未来,Keep和OPPO将发挥在各自领域的专业优势,在硬件、AI大模型等领域展开深度合作,推动双方长期发展。 Keep称,作为全球领先的线上健身平台,有信心与全球领先的智能设备制造商一起,为行业探索运动智能化带来新的突破口。OP
Science:谷歌AI新模型预测天气快又准
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512459.shtm编译 | 辛雨 图片来源:Carlos Munoz Yague 人工智能(AI)公司Google DeepMind开发的机器学习模型GraphCast,在“3至
AI模型搜寻癌症线索速度远超以往
质谱仪可以检测人体细胞中糖分子的不同结构。图片来源:马格努斯·戈坦德/伦德伯格研究基金会科技日报北京7月10日电 (记者张梦然)瑞典哥德堡大学团队开发了一种人工智能(AI)模型,通过糖分析增加检测癌症的可能性。与当前的半手动方法相比,AI模型能在几秒钟内准确发现异常。研究结果发表在新一期《自然·方法
模拟芯片大幅削减AI模型运行能耗
模拟计算机芯片运行人工智能(AI)语音识别模型的效率是传统芯片的14倍,有可能为AI研究中巨大且不断增长的能源消耗以及全球范围内通用数字芯片短缺问题提供解决方案。 这一新产品由IBM Research开发,概述这项工作的论文发表于《自然》。研究人员声称,模拟芯片可以减少人工智能发展的障碍。
AI模型可为癌症患者选择最佳疗法
科技日报讯 (记者刘霞)来自澳大利亚国立大学、美国国家癌症研究所和Pangea Biomed制药公司的科学家,成功开发出一种人工智能(AI)模型“DeepPT”,可以帮助医生为癌症患者选择最佳疗法。相关研究论文发表于最新一期《自然·癌症》杂志。“DeepPT”通过预测患者的信使核糖核酸(mRNA)图
模拟芯片大幅削减AI模型运行能耗
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507457.shtm
《自然》发文盛赞中国开源AI模型DeepSeek
最近,由来自杭州的“深度求索”初创团队开发的DeepSeek系列AI模型,引发了全球范围的关注。1月24日,知名学术期刊《自然》也发文关注该模型及相应产品,称“中国开发的大语言模型DeepSeek-R1以亲民价格和开放性挑战了OpenAI的推理模型GPT-o1的地位,令科学家们感到兴奋”。《中国科学
AI新模型快速预测材料光学性质
未来的中央处理器(艺术图)。图片来源:美国趣味工程网站科技日报讯 (记者刘霞)据美国趣味工程网站近日报道,日本东北大学和美国麻省理工学院科学家,成功开发出一款新人工智能(AI)模型GNNOpt。该模型能以与量子模拟相同的精度预测材料的光学性质,但速度能快100万倍。研究团队表示,这一重要进展有望加速
AI有感情吗?舞剧《深AI你》登陆国家大剧院
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507297.shtm8月25日至27日,由中共深圳市委宣传部、深圳市文化广电旅游体育局出品的舞剧《深AI你》登上国家大剧院舞台。作为国内首部人工智能题材舞剧作品,《深AI你》带来一场科技魅力和人文思考的双
AI赋能未来药学,数智岐黄中医药大模型发布
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516371.shtm1月19日,由华东师范大学主办的“AI赋能下的未来药学产学研发展论坛暨华东师范大学药学学科发展大会”在沪召开。会上发布了“数智岐黄”中医药大模型,该大模型由华东师范大学、上海中医药大学
“风乌”气象大模型团队:用AI预报极端天气未来不是梦
近期全球出现一系列极端天气,严重危及人类生产生活,各国对于更加精准、高效的中长期天气预报的需求不断提升。近日,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”。《环球时报》记者日前专访了“风乌”大模
AI大模型助力前列腺癌无创精准诊断与分级
海军军医大学第二附属医院(上海长征医院)泌尿外科教授任善成团队联合国内多家单位,构建了一种基于人工智能(AI)的前列腺癌影像—病理基础模型,可从磁共振影像中无创预测肿瘤侵袭性,且诊断性能显著优于现有临床方法,为前列腺癌无创精准诊断与分级提供了新方向。相关研究9月2日发表于《自然-癌症》。前列腺癌已成
清华大学团队研发AI光芯片赋能大模型算力
记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算架构,研制大规模干涉-衍射异构集成芯片太极(Taichi),实现160 TOPS/W的通用智能计算。在如今大模型通用人工智能蓬
中国科学院香港创新院发布医疗健康AI大模型
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518896.shtm
用AI赋能全流程患者管理-“智医随行”大模型发布
7月11日,中国科学技术大学附属第一医院(安徽省立医院)医学人工智能联合实验室正式推出“智医随行”大模型,用AI赋能全流程患者管理。据悉,该模型通过本地化部署,深度融合讯飞星火医疗大模型的专病管理路径知识库与中国科大附一院专科知识库,为医护人员打造覆盖患者“预防-治疗-康复-随访”全周期的AI助手。
用AI赋能全流程患者管理-“智医随行”大模型发布
7月11日,中国科学技术大学附属第一医院(安徽省立医院)医学人工智能联合实验室正式推出“智医随行”大模型,用AI赋能全流程患者管理。据悉,该模型通过本地化部署,深度融合讯飞星火医疗大模型的专病管理路径知识库与中国科大附一院专科知识库,为医护人员打造覆盖患者“预防-治疗-康复-随访”全周期的AI助手。
大连化物所发布“氢能AI助手大模型”2.0版本
近日,中国科学院大连化学物理研究所低碳战略研究中心通过线上线下相结合的方式,正式发布“氢能AI助手大模型”2.0版本。低碳战略研究中心副主任李婉君研究员介绍了“氢能AI助手大模型”的研发背景、研发进展、2.0版本的主要功能、研发计划等。“氢能AI助手大模型”采用多模态数据解析-领域知识精炼-RAG增
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso