提高大语言模型可信度,新方法助生成式AI破除“幻觉”
人工智能(AI)在给出准确答案的同时,也会有一些“胡乱输出”令人难辨真假,这被称为“幻觉”(hallucination)。而新一期《自然》杂志发表的一项研究报道了一种新方法,能检测大语言模型(LLM)产生的“幻觉”,即该方法能测量生成回答的含义的不确定性,或能提升LLM输出答案的可靠性。类似ChatGPT和Gemini等LLM,是能阅读和生成自然人类语言的AI系统。不过,这类系统很容易产生所谓“幻觉”,即生成不准确或没有意义的内容。检测LLM出现的这种错误非常难,因为这些回答的呈现方式看起来很可信。英国牛津大学研究团队此次尝试量化一个LLM产生此类错误的程度,从而判断生成的内容有多忠于提供的源内容。他们的方法能检测“编造”——这是幻觉的一个子类别,特指不准确和随意的内容,常出现在LLM缺乏某类知识的情况下。这种方法考虑了语言的微妙差别,以及回答如何能以不同的方式表达,从而拥有不同的含义。团队的研究表明,他们的方法能在LLM生成的......阅读全文
便携式AI系统可将大脑思想翻译成语言
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514134.shtm 研究人员正在测试DeWave模型。图片来源:悉尼科技大学据物理学家组织网11日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并
便携式AI系统可将大脑思想翻译成语言
据物理学家组织网11日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新研究代表了将原始脑电图(EEG
AI教育风潮席卷中国高校-学生用AI学AI
“What does this machine do(这台机器是干什么的)?”4日下午,西南交通大学孟加拉国留学生Zahidul Alam拍下身前吊弦疲劳试验仪器的照片。收到他的语音提问后,手机中的24小时在线“AI学伴”瞬间给出如论文般详细的英文回答。 这是西南交大首门人工智能通识课的第一课
警惕AI技术泡沫-梅宏院士呼吁建立完善治理体系
“智能是人类区别于其他动物的专有特征,特别是认知能力,我们可以接受机器在感知能力方面超越人类,但对机器认知智能的研发,需要高度审慎。从科技伦理的视角来看,我们为什么要去造出一个替代我们认知的东西?”11月22日,在以“跨越边界的科技伦理”为主题的第二届中国科技伦理高峰论坛上,中国科学院院士、北京大学
新引擎实现大语言模型推理速度显著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
国产-AI-大模型-DeepSeek-升级,性能对标-OpenAI-o1-正式版
1 月 20 日,国产 AI 大模型 DeepSeek 正式发布新版本 DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-
AI应用正推动精神健康服务向智能化方向发展
由《科学》(Science)杂志、上海市精神卫生中心(国家精神疾病医学中心)等联合主办的"人工智能与精神健康"研讨会11月8日在上海举行。近400位科学家、临床医生、产业界精英参会,共同探讨人工智能在精神健康领域的应用与未来发展。主办方表示,期待吸引各方人才,特别是AI人才加入,用人工智能技术,更好
生物学领域最大规模AI模型发布
2月19日,美国弧形研究所、美国芯片制造商英伟达公司和美国斯坦福大学等机构的研究人员共同开发的人工智能(AI)生物学模型Evo 2正式发布。目前,该模型已开放给全球科研人员,他们可通过网页使用该模型,还可免费下载该模型的源代码、训练数据及参数。美国弧形研究所在其官网发布公报称,在前一代模型Evo 1
武汉专家开发AI模型助力胰腺癌诊断
华中科技大学同济医学院附属同济医院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片,对胰腺占位作出诊断。相关研究成果于近日发表在国际期刊《JAMA Network Open》。胰腺癌是胰腺肿块的常见原因,超声内镜是诊断胰腺癌的重要手段。然而,其它恶性
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。CARBonAra是在一个包含约370000个
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。CARBonAra是在一个包含约370000个
深度思维AI模型表现超越现有天气预报
新一期《自然》杂志发表的一项研究报道了深度思维推出的最新机器学习模型。该模型能根据当前和未来天气进行可靠的概率天气预报,其表现不但超过了最好的传统中程天气预报,还能更好地预测极端天气、热带气旋路线和风能产量。GenCast相关预报的可视化。图片来源:《自然》网站准确的天气预报对于个人、政府和组织的日
AI新模型精准预测细胞内基因活动
哥伦比亚大学瓦格洛斯内外科医学院团队开发了一种创新的人工智能(AI)模型——通用表达转换器(GET),该模型能够精确预测人类细胞内的基因活动,为理解细胞内部工作机制提供了全新视角。这项突破性成果可帮助科学家以前所未有的方式,探索从癌症到遗传疾病等一系列健康问题,推动医学研究向前迈进一大步。相关论文发
武汉专家开发AI模型助力胰腺癌诊断
中新网武汉8月7日电 (常宇)据华中科技大学同济医学院附属同济医院7日消息,该院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片,对胰腺占位作出诊断。相关研究成果于近日发表在国际期刊《JAMA Network Open》。胰腺癌是胰腺肿块的常见原因,
AI模型10秒内检出脑肿瘤残留
美国密歇根大学和加利福尼亚大学旧金山分校领导的研究人员开发出一款名为FastGlioma的人工智能(AI)模型。在脑手术中,该模型仅用10秒就判断出是否还有残留的癌性肿瘤。在识别肿瘤残留方面,FastGlioma的表现远超传统方法,有望给神经外科领域带来变革。研究成果发表在最新一期《自然》杂志上。在
AI模型可预测癌症原发灶位点
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/506190.shtm根据《自然·医学》杂志7日发表的一篇论文,美国麻省理工学院和达纳-法伯癌症研究所的研究人员开发了一种新方法,使识别一些神秘癌症的原发灶位置变得更容易。 在原发灶不明的癌症中,癌
预测蛋白质序列的新AI模型问世
使用CARBonAra进行序列预测(示意图)。图片来源:瑞士洛桑联邦理工学院科技日报北京8月8日电 (记者张佳欣)瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内
AI模型可提供快速可靠的心脏健康评估
来自英国东安格利亚大学、谢菲尔德大学和利兹大学的团队共同开发出一种智能计算机模型,可利用人工智能(AI)分析心脏磁共振成像(MRI)检查结果。这种自动化技术不仅能为患者提供快速可靠的心脏健康评估,还能显著节省时间和资源。论文发表于近日出版的《欧洲放射学实验杂志》上。研究人员表示,AI模型能精确测定心
AI新模型精准预测细胞内基因活动
哥伦比亚大学瓦格洛斯内外科医学院团队开发了一种创新的人工智能(AI)模型——通用表达转换器(GET),该模型能够精确预测人类细胞内的基因活动,为理解细胞内部工作机制提供了全新视角。这项突破性成果可帮助科学家以前所未有的方式,探索从癌症到遗传疾病等一系列健康问题,推动医学研究向前迈进一大步。相关论文发
AI模型可提供快速可靠的心脏健康评估
来自英国东安格利亚大学、谢菲尔德大学和利兹大学的团队共同开发出一种智能计算机模型,可利用人工智能(AI)分析心脏磁共振成像(MRI)检查结果。这种自动化技术不仅能为患者提供快速可靠的心脏健康评估,还能显著节省时间和资源。论文发表于近日出版的《欧洲放射学实验杂志》上。研究人员表示,AI模型能精确测定心
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。使用CARBonAra进行序列预测(示意图
武汉专家开发AI模型助力胰腺癌诊断
华中科技大学同济医学院附属同济医院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片,对胰腺占位作出诊断。相关研究成果于近日发表在国际期刊《JAMA Network Open》。胰腺癌是胰腺肿块的常见原因,超声内镜是诊断胰腺癌的重要手段。然而,其它恶性
AI模型10秒内检出脑肿瘤残留
美国密歇根大学和加利福尼亚大学旧金山分校领导的研究人员开发出一款名为FastGlioma的人工智能(AI)模型。在脑手术中,该模型仅用10秒就判断出是否还有残留的癌性肿瘤。在识别肿瘤残留方面,FastGlioma的表现远超传统方法,有望给神经外科领域带来变革。研究成果发表在最新一期《自然》杂志上
AI模型可预测癌症原发灶位点
根据《自然·医学》杂志7日发表的一篇论文,美国麻省理工学院和达纳-法伯癌症研究所的研究人员开发了一种新方法,使识别一些神秘癌症的原发灶位置变得更容易。 研究人员利用近3万名22种已知癌症的患者数据来训练机器学习模型,它可分析大约400个基因序列,这些基因经常在癌症中发生突变。然后,研究人员使用
让AI模型更通用的新技术入选NeurIPS
近日,人工智能(AI)研究领域顶级会议NeurIPS(神经信息处理系统大会)正式在官网公布NeurIPS 2020接收论文表。中科院计算所与阿里安全图灵实验室、鹏城实验室共同完成的《启发式领域适应》(Heuristic Domain Adaptation)获录入选。 如何更好地将AI在某一场
用AI识别AI:西湖大学研究可检测AI生成文本
虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利,但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT,无需训练即可识别各种AI大语言模型生
科学之眼问世:美国化学学会CAS推出专为科研设计的智能体AI——Newton,重塑药物发现工作流
科学数据库巨头CAS(美国化学学会旗下专注科学知识管理的机构)近日宣布推出其历史上首款智能体人工智能产品——CAS Newton。这款AI并非泛化的大语言模型,而是一款深度嵌入CAS150年积累的经同行评审的科学文献和结构化数据库之上的专业工具,覆盖化学、生物学、材料科学和知识产权等核心领域。 N
ChatGPT的拷问:何为AI伦理、AI治理
前不久,AI聊天机器人程序ChatGPT席卷全球,完成了AI第一次大规模的自传播。作为人工智能领域的现象级应用,ChatGPT可能引发的信任、责任、伦理、法律等问题也很快引发各界关注与担忧。近年来,不少关于人工智能(AI),并和人类生产、生活关系紧密的议题被广泛讨论,诸如“如何应对AI可能对社会产生
ChatGPT的拷问:何为AI伦理、AI治理
原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494707.shtm 前不久,AI聊天机器人程序ChatGPT席卷全球,完成了AI第一次大规模的自传播。作为人工智能领域的现象级应用,ChatGPT可能引发的信任、责任、伦理、法律等问题也很快引发各
“AI+”时代-|-AI“解码”免疫系统
人体免疫系统包含了很多有关身体健康的信息,其中的关键部分就包含在血液中。医学界提出了一个大胆设想:通过创建一个万能的血液测试,采集免疫系统与病原体之间的反应信息,绘制“免疫图谱”,从而解码免疫系统中的信息,及时在疾病恶化前筛查确诊。那么,什么样的平台能提供足够的计算力,不断通过机器学习和精准模型