提高大语言模型可信度,新方法助生成式AI破除“幻觉”

人工智能(AI)在给出准确答案的同时,也会有一些“胡乱输出”令人难辨真假,这被称为“幻觉”(hallucination)。而新一期《自然》杂志发表的一项研究报道了一种新方法,能检测大语言模型(LLM)产生的“幻觉”,即该方法能测量生成回答的含义的不确定性,或能提升LLM输出答案的可靠性。类似ChatGPT和Gemini等LLM,是能阅读和生成自然人类语言的AI系统。不过,这类系统很容易产生所谓“幻觉”,即生成不准确或没有意义的内容。检测LLM出现的这种错误非常难,因为这些回答的呈现方式看起来很可信。英国牛津大学研究团队此次尝试量化一个LLM产生此类错误的程度,从而判断生成的内容有多忠于提供的源内容。他们的方法能检测“编造”——这是幻觉的一个子类别,特指不准确和随意的内容,常出现在LLM缺乏某类知识的情况下。这种方法考虑了语言的微妙差别,以及回答如何能以不同的方式表达,从而拥有不同的含义。团队的研究表明,他们的方法能在LLM生成的......阅读全文

AI大模型助力前列腺癌无创精准诊断与分级

海军军医大学第二附属医院(上海长征医院)泌尿外科教授任善成团队联合国内多家单位,构建了一种基于人工智能(AI)的前列腺癌影像—病理基础模型,可从磁共振影像中无创预测肿瘤侵袭性,且诊断性能显著优于现有临床方法,为前列腺癌无创精准诊断与分级提供了新方向。相关研究9月2日发表于《自然-癌症》。前列腺癌已成

“风乌”气象大模型团队:用AI预报极端天气未来不是梦

  近期全球出现一系列极端天气,严重危及人类生产生活,各国对于更加精准、高效的中长期天气预报的需求不断提升。近日,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”。《环球时报》记者日前专访了“风乌”大模

用AI赋能全流程患者管理-“智医随行”大模型发布

7月11日,中国科学技术大学附属第一医院(安徽省立医院)医学人工智能联合实验室正式推出“智医随行”大模型,用AI赋能全流程患者管理。据悉,该模型通过本地化部署,深度融合讯飞星火医疗大模型的专病管理路径知识库与中国科大附一院专科知识库,为医护人员打造覆盖患者“预防-治疗-康复-随访”全周期的AI助手。

AI赋能未来药学,数智岐黄中医药大模型发布

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516371.shtm1月19日,由华东师范大学主办的“AI赋能下的未来药学产学研发展论坛暨华东师范大学药学学科发展大会”在沪召开。会上发布了“数智岐黄”中医药大模型,该大模型由华东师范大学、上海中医药大学

中国科学院香港创新院发布医疗健康AI大模型

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518896.shtm

大连化物所发布“氢能AI助手大模型”2.0版本

近日,中国科学院大连化学物理研究所低碳战略研究中心通过线上线下相结合的方式,正式发布“氢能AI助手大模型”2.0版本。低碳战略研究中心副主任李婉君研究员介绍了“氢能AI助手大模型”的研发背景、研发进展、2.0版本的主要功能、研发计划等。“氢能AI助手大模型”采用多模态数据解析-领域知识精炼-RAG增

AI有感情吗?舞剧《深AI你》登陆国家大剧院

原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507297.shtm8月25日至27日,由中共深圳市委宣传部、深圳市文化广电旅游体育局出品的舞剧《深AI你》登上国家大剧院舞台。作为国内首部人工智能题材舞剧作品,《深AI你》带来一场科技魅力和人文思考的双

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso

中外青年热议生成式AI的局限

近日,国家网信办发布了《生成式人工智能(AI)服务管理办法(征求意见稿)》,针对面向中国境内公众提供服务的生成式人工智能产品,包括其研发及服务,向社会公开征求管理意见。生成式AI正是当前以ChatGPT等智能聊天机器人为代表的技术。自去年11月ChatGPT发布以来,其展示的与人类高度相似的对话能力

中外青年热议生成式AI的局限

  近日,国家网信办发布了《生成式人工智能(AI)服务管理办法(征求意见稿)》,针对面向中国境内公众提供服务的生成式人工智能产品,包括其研发及服务,向社会公开征求管理意见。  生成式AI正是当前以ChatGPT等智能聊天机器人为代表的技术。自去年11月ChatGPT发布以来,其展示的与人类高度相似的

人工智能辅助科研要从可用走向可信

未来,人工智能或将帮助科研工作者跳过文献检索、粗读的过程,直接找到需要的文献,大幅提升科研工作者的文献阅读效率。对于科研工作者来说,检索、阅读文献是一项费时费力的工作。在大模型发展如火如荼的今天,以其为代表的人工智能正渗透进人们工作生活的各个角落,科研领域也不例外。日前,阿里巴巴发布了基于Trans

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

AI模型准确进行天气预测与气候模拟

  《自然》23日报道了一种人工智能(AI)模型。该模型名为“NeuralGCM”,结合了流体动力学与神经网络,能进行准确的天气预测和气候模拟。模型超越了部分现有模型,与传统模型相比,有望节省大量算力。“NeuralGCM”模型结构。其结合了传统的流体动力学求解器和用于小尺度物理的神经网络。图片来源

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。澳大利亚“对话”网站在本月稍早时间报道中指出,合成数据

AI模型精准预测飓风“梅丽莎”迅猛增强

  近日,飓风“梅丽莎”迅速增强为五级飓风。在此过程中,科学家使用了一个强大的新工具——谷歌DeepMind开发的人工智能(AI)模型,成功预测了其路径和强度变化,为牙买加及其他受风暴破坏严重的国家发布预警。  该模型今年首次被美国国家飓风中心(NHC)使用,NHC是飓风信息的主要来源。这是一种专门

微软AI模型超越当前地球系统预报水平

美国微软公司开发了一个超越现有地球系统预报水平的AI模型。除了提供高分辨率的天气预报,这个名为Aurora的模型还有望更准确和高效地预报空气质量、热带气旋路径和海浪动力学。该成果5月21日发表于《自然》。地球系统预报能提供多种过程的信息,如天气、空气质量、洋流、海冰和飓风,是对极端事件做出早期预警的

合成数据能否让AI模型精确可靠?

  人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。  澳大利亚“对话”网站在本月稍早时间报道中指出,

AI模型准确进行天气预测与气候模拟

《自然》23日报道了一种人工智能(AI)模型。该模型名为“NeuralGCM”,结合了流体动力学与神经网络,能进行准确的天气预测和气候模拟。模型超越了部分现有模型,与传统模型相比,有望节省大量算力。“NeuralGCM”模型结构。其结合了传统的流体动力学求解器和用于小尺度物理的神经网络。图片来源:谷

AI重现黑洞耀斑的3D模型

美国科学家利用类似CT扫描的3D技术重建了银河系中心超大质量黑洞人马座A*附近的高能爆发事件图,更清晰地呈现了黑洞周围的亮斑是如何形成的。研究结果4月22日发表于《自然—天文学》。超级计算机模拟显示,以吸积盘结构绕黑洞旋转的物质会在名为耀斑的高能事件中周期性喷发,这类事件可在X射线、红外线和无线电波

新AI模型或更准确预测气象灾害

  谷歌公司最近发布了一款新的生成式人工智能(AI)模型——可扩展集成包络扩散采样器(SEEDS)。该公司称,SEEDS能提供更准确的天气预报信息,比传统方法成本更低,而且能检测到难以发现的极端天气事件。相关论文发表于最新一期《科学进展》杂志。  谷歌表示,SEEDS模型与ChatGPT等流行的大型

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。澳大利亚“对话”网站在本月稍早时间报道中指出,合成数据

多项AI+未来农业大模型成果发布

12月12日,南京农业大学与江苏省南京市江北新区研创园联合举办农业科学AI成果发布会暨人工智能OPC基地揭牌仪式。来自高校、政府、企业、投资机构的近百位代表共同见证5项引领AI+未来农业的成果集中发布。南京农业大学副校长丁艳锋与江北新区研创园党工委书记、管办主任吴恒共同为“南京农业大学-南京江北新区

AI模型帮助诊断这种高风险疾病

广义的结构性心脏病(structural heart disease,SHD)指任何心脏结构的异常,任何与心脏和大血管结构有关的疾病。其是一种进行性疾病,这意味着症状会随着时间的推移而恶化,如果不及早发现和治疗,死亡率较高。所以,早期诊断和治疗是改善患者预后的关键。 当地时间5月24日,美国区域

新AI模型或更准确预测气象灾害

与传统模型相比,SEEDS能更快、更高效地预测灾害天气。图片来源:美国趣味科学网站科技日报讯 (记者刘霞)谷歌公司最近发布了一款新的生成式人工智能(AI)模型——可扩展集成包络扩散采样器(SEEDS)。该公司称,SEEDS能提供更准确的天气预报信息,比传统方法成本更低,而且能检测到难以发现的极端天气

文心大模型4.0发布,李彦宏:AI原生时代将至

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510379.shtm“今天,你说的每一句话,它大概率都能听懂。”10月17日,百度世界大会2023在京举行,会上百度发布了文心大模型4.0。李彦宏以《手把手教你做AI原生应用》为主题发表演讲,提出“我们

张勇:AI时代所有产品都值得用大模型重做一次

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498288.shtm4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在阿里云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得

一年零一月,文心大模型进化成AI创造“底牌”

“未来,自然语言将成为新的通用编程语言。”4月16日,Create 2024百度AI开发者大会在深圳举行。百度公司董事长兼首席执行官李彦宏作“人人都是开发者”的主题演讲,并带来了“开箱即用”的三大AI开发工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺

东北大学研究团队发布TechGPT2.0大语言模型

  近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。  TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得

东北大学研究团队发布TechGPT2.0大语言模型

近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适