合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。 澳大利亚“对话”网站在本月稍早时间报道中指出,合成数据具有诸多优势,但过度依赖合成数据也可能削弱AI的精确性和可靠性。 合成数据应运而生 以往,科技公司主要依赖真实数据来构建、训练和改进AI模型。真实数据是指由人类创建的文本、视频和图像。它们通过调查、实验、观察或挖掘网站和社交媒体等途径被收集而来。 真实数据因蕴含真实事件以及其场景和背景而极具价值,但其并非尽善尽美。它可能掺杂拼写错误、不一致或无关的内容,甚至潜藏严重偏见,导致生成式AI模型在某些情况下创建的图像仅展示男性或白人形象。 但真实数据日益匮乏,因为人类生成数据的速度赶不上AI不断增长的需求。 美国开放人工智......阅读全文

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。澳大利亚“对话”网站在本月稍早时间报道中指出,合成数据

用AI生成数据训练AI或导致模型崩溃

科技日报北京7月25日电 (记者张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野

用AI生成数据训练AI或导致模型崩溃

  《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练

《自然》封面:以AI生成数据训练AI,模型变傻?

大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡言乱语”

《自然》封面:以AI生成数据训练AI,模型变傻?

  大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——  近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡

生成式AI时代,大模型数据安全如何保障?

在生成式AI(人工智能)时代,数据安全的出路可能会是“用魔法打败魔法”,知识产权保护也可能要提前到token(字符串)层面。4月26日,在2024中关村论坛上,人工智能企业与学者就AI大模型的数据安全问题进行了讨论。中关村论坛数据安全治理与发展论坛现场  澎湃新闻记者 秦盛 摄“在生成式人工智能时代

3大遥感数据源接入“商汤地界”AI遥感大模型

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519533.shtm近日,商汤科技宣布携手国内头部遥感数据平台“吉林一号网”、“四维地球”、“星图地球”,升级了其“SenseEarth智能遥感云”平台的数据源。用户无需准备数据,即可通过“商汤地界”平台

AI语言模型“提速”药物发现

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结

AI“模型崩溃”风险需警惕

从客户服务到内容创作,人工智能(AI)影响了众多领域的进展。但是,一个日益严重的被称为“模型崩溃”的问题,可能会使AI的所有成就功亏一篑。“模型崩溃”是今年7月发表在英国《自然》杂志上的一篇研究论文指出的问题。它是指用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出。多家外媒报

DeepMind-AI模型预测天气又快又好

近日一项发表于《自然》的研究报道了谷歌DeepMind开发的首个天气预测人工智能(AI)模型——GenCast。该模型比目前运行中的最佳中期预报系统——欧洲中期天气预报中心的集合预报(ENS)更精准。GenCast在8分钟内就能完成15天的预测,而目前的预测程序需要几个小时。据介绍,包括ENS在内的

AI大模型“拿捏”电池寿命

作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还

用AI数据训练AI可能最终导致崩溃

《自然》7月24日发表的一篇论文指出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”(model collapse)。该研究显示,原始内容会在数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。生成式AI工具越来越受欢迎,如大语言

用AI数据训练AI可能最终导致崩溃

  《自然》7月24日发表的一篇论文指出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”(model collapse)。该研究显示,原始内容会在数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。  生成式AI工具越来越受欢迎,

AI视频生成模型Sora来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm

AI大模型“源”炼造客服大脑

  2018年至今,NLP领域经历了非常大的变化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微调)的突破,NLP在预训练大模型的暴力拆解路上越走越远,这也让各行业开始相信:很多之前无法做到的场景、效果,现在可以有新的解法和落地。  智能客服,是

模拟芯片大幅削减AI模型运行能耗

原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507457.shtm

AI模型搜寻癌症线索速度远超以往

质谱仪可以检测人体细胞中糖分子的不同结构。图片来源:马格努斯·戈坦德/伦德伯格研究基金会科技日报北京7月10日电 (记者张梦然)瑞典哥德堡大学团队开发了一种人工智能(AI)模型,通过糖分析增加检测癌症的可能性。与当前的半手动方法相比,AI模型能在几秒钟内准确发现异常。研究结果发表在新一期《自然·方法

AI模型可为癌症患者选择最佳疗法

科技日报讯 (记者刘霞)来自澳大利亚国立大学、美国国家癌症研究所和Pangea Biomed制药公司的科学家,成功开发出一种人工智能(AI)模型“DeepPT”,可以帮助医生为癌症患者选择最佳疗法。相关研究论文发表于最新一期《自然·癌症》杂志。“DeepPT”通过预测患者的信使核糖核酸(mRNA)图

华为发布大模型时代AI存储新品

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504751.shtm

模拟芯片大幅削减AI模型运行能耗

  模拟计算机芯片运行人工智能(AI)语音识别模型的效率是传统芯片的14倍,有可能为AI研究中巨大且不断增长的能源消耗以及全球范围内通用数字芯片短缺问题提供解决方案。  这一新产品由IBM Research开发,概述这项工作的论文发表于《自然》。研究人员声称,模拟芯片可以减少人工智能发展的障碍。  

AI大模型走出“泡沫期”未来何如

  今年3月ChatGPT-4上线以来,国内科技龙头企业密集推出人工智能大模型,百度“文心一言”、阿里云“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场,呈现百花齐放、迅猛发展的态势。截至2023年10月初,国

Science:谷歌AI新模型预测天气快又准

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512459.shtm编译 | 辛雨 图片来源:Carlos Munoz Yague 人工智能(AI)公司Google DeepMind开发的机器学习模型GraphCast,在“3至

AI模型帮助诊断这种高风险疾病

广义的结构性心脏病(structural heart disease,SHD)指任何心脏结构的异常,任何与心脏和大血管结构有关的疾病。其是一种进行性疾病,这意味着症状会随着时间的推移而恶化,如果不及早发现和治疗,死亡率较高。所以,早期诊断和治疗是改善患者预后的关键。 当地时间5月24日,美国区域

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

AI模型准确进行天气预测与气候模拟

《自然》23日报道了一种人工智能(AI)模型。该模型名为“NeuralGCM”,结合了流体动力学与神经网络,能进行准确的天气预测和气候模拟。模型超越了部分现有模型,与传统模型相比,有望节省大量算力。“NeuralGCM”模型结构。其结合了传统的流体动力学求解器和用于小尺度物理的神经网络。图片来源:谷

AI模型准确进行天气预测与气候模拟

  《自然》23日报道了一种人工智能(AI)模型。该模型名为“NeuralGCM”,结合了流体动力学与神经网络,能进行准确的天气预测和气候模拟。模型超越了部分现有模型,与传统模型相比,有望节省大量算力。“NeuralGCM”模型结构。其结合了传统的流体动力学求解器和用于小尺度物理的神经网络。图片来源

新AI模型或更准确预测气象灾害

与传统模型相比,SEEDS能更快、更高效地预测灾害天气。图片来源:美国趣味科学网站科技日报讯 (记者刘霞)谷歌公司最近发布了一款新的生成式人工智能(AI)模型——可扩展集成包络扩散采样器(SEEDS)。该公司称,SEEDS能提供更准确的天气预报信息,比传统方法成本更低,而且能检测到难以发现的极端天气

新AI模型或更准确预测气象灾害

  谷歌公司最近发布了一款新的生成式人工智能(AI)模型——可扩展集成包络扩散采样器(SEEDS)。该公司称,SEEDS能提供更准确的天气预报信息,比传统方法成本更低,而且能检测到难以发现的极端天气事件。相关论文发表于最新一期《科学进展》杂志。  谷歌表示,SEEDS模型与ChatGPT等流行的大型

AI重现黑洞耀斑的3D模型

美国科学家利用类似CT扫描的3D技术重建了银河系中心超大质量黑洞人马座A*附近的高能爆发事件图,更清晰地呈现了黑洞周围的亮斑是如何形成的。研究结果4月22日发表于《自然—天文学》。超级计算机模拟显示,以吸积盘结构绕黑洞旋转的物质会在名为耀斑的高能事件中周期性喷发,这类事件可在X射线、红外线和无线电波