合成数据能否让AI模型精确可靠？

人工智能（AI）初创公司xAI创始人埃隆·马斯克近日表示：“在AI训练中，我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明，人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺，为满足AI的“胃口”，科技行业正转向使用合成数据。澳大利亚“对话”网站在本月稍早时间报道中指出，合成数据具有诸多优势，但过度依赖合成数据也可能削弱AI的精确性和可靠性。合成数据应运而生以往，科技公司主要依赖真实数据来构建、训练和改进AI模型。真实数据是指由人类创建的文本、视频和图像。它们通过调查、实验、观察或挖掘网站和社交媒体等途径被收集而来。真实数据因蕴含真实事件以及其场景和背景而极具价值，但其并非尽善尽美。它可能掺杂拼写错误、不一致或无关的内容，甚至潜藏严重偏见，导致生成式AI模型在某些情况下创建的图像仅展示男性或白人形象。但真实数据日益匮乏，因为人类生成数据的速度赶不上AI不断增长的需求。美国开放人工智......阅读全文

合成数据能否让AI模型精确可靠？

人工智能（AI）初创公司xAI创始人埃隆·马斯克近日表示：“在AI训练中，我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明，人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺，为满足AI的“胃口”，科技行业正转向使用合成数据。澳大利亚“对话”网站在本月稍早时间报道中指出，合成数据

2025-01-22 14:47 News WIKI 相关搜索

合成数据能否让AI模型精确可靠？

2025-02-08 22:10 News WIKI 相关搜索

合成数据能否让AI模型精确可靠？

　　人工智能（AI）初创公司xAI创始人埃隆·马斯克近日表示：“在AI训练中，我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明，人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺，为满足AI的“胃口”，科技行业正转向使用合成数据。　　澳大利亚“对话”网站在本月稍早时间报道中指出，

2025-02-04 21:38 News WIKI 相关搜索

用AI生成数据训练AI或导致模型崩溃

科技日报北京7月25日电（记者张梦然）《自然》24日正式发表的一篇研究论文指出了一个人工智能（AI）严重问题：用AI生成的数据集训练未来几代机器学习模型，可能会严重“污染”它们的输出，这被称为“模型崩溃”。研究显示，原始内容会在9次迭代以后，变成不相关的“胡言乱语”（演示中一个建筑文本最终变成了野

2024-07-26 08:55 News WIKI 相关搜索

用AI生成数据训练AI或导致模型崩溃

　　《自然》24日正式发表的一篇研究论文指出了一个人工智能（AI）严重问题：用AI生成的数据集训练未来几代机器学习模型，可能会严重“污染”它们的输出，这被称为“模型崩溃”。研究显示，原始内容会在9次迭代以后，变成不相关的“胡言乱语”（演示中一个建筑文本最终变成了野兔的名字），这凸显出使用可靠数据训练

2024-07-26 14:07 News WIKI 相关搜索

《自然》封面：以AI生成数据训练AI，模型变傻？

大模型有许多“崩”的时候，但有一种崩溃叫做“自毁前程”——近日，《自然》发表在封面的一篇论文指出，用AI生成的数据集训练未来几代机器学习模型，可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示，原始内容会在数代内变成不相关的“胡言乱语”

2024-07-28 17:29 News WIKI 相关搜索

《自然》封面：以AI生成数据训练AI，模型变傻？

　　大模型有许多“崩”的时候，但有一种崩溃叫做“自毁前程”——　　近日，《自然》发表在封面的一篇论文指出，用AI生成的数据集训练未来几代机器学习模型，可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示，原始内容会在数代内变成不相关的“胡

2024-07-30 16:53 News WIKI 相关搜索

生成式AI时代，大模型数据安全如何保障？

在生成式AI（人工智能）时代，数据安全的出路可能会是“用魔法打败魔法”，知识产权保护也可能要提前到token（字符串）层面。4月26日，在2024中关村论坛上，人工智能企业与学者就AI大模型的数据安全问题进行了讨论。中关村论坛数据安全治理与发展论坛现场澎湃新闻记者秦盛摄“在生成式人工智能时代

2024-04-27 07:56 News WIKI 相关搜索

3大遥感数据源接入“商汤地界”AI遥感大模型

原文地址：http://news.sciencenet.cn/htmlnews/2024/3/519533.shtm近日，商汤科技宣布携手国内头部遥感数据平台“吉林一号网”、“四维地球”、“星图地球”，升级了其“SenseEarth智能遥感云”平台的数据源。用户无需准备数据，即可通过“商汤地界”平台

2024-03-22 17:55 News WIKI 相关搜索

启信慧眼发布商业大数据领域AI大模型应用，降低“AI幻觉”概率

7月17日，上海合合信息科技股份有限公司旗下启信慧眼宣布完成品牌升级，定位为“商业数据智能决策企业级AI产品”。同时，启信慧眼首次发布中国商业大数据领域AI大模型应用，聚焦企业营销、尽调、风控等核心场景，赋能企业数智化转型。“慧眼”寓意洞察本质、明辨真伪的能力。合合信息数据事业部副总经理沈东辉表示，

2025-07-18 09:57 News WIKI 相关搜索

AI“模型崩溃”风险需警惕

图片来源：美国《The Week》从客户服务到内容创作，人工智能（AI）影响了众多领域的进展。但是，一个日益严重的被称为“模型崩溃”的问题，可能会使AI的所有成就功亏一篑。“模型崩溃”是今年7月发表在英国《自然》杂志上的一篇研究论文指出的问题。它是指用AI生成的数据集训练未来几代机器学习模型，可能会

2024-09-25 09:24 News WIKI 相关搜索

AI大模型“拿捏”电池寿命

作为现代生活中不可或缺的能源载体，电池的重要性不言而喻。从清晨唤醒我们的闹钟，到随身携带的手机、平板电脑等智能设备，无一不依赖于电池提供的稳定电力。此外，随着科技的发展，电动汽车、无人机等新兴领域也广泛应用了各类高性能电池，推动了绿色出行和智能科技的进步。因此，电池不仅极大地便利了我们的日常生活，还

2024-09-18 15:57 News WIKI 相关搜索

AI语言模型“提速”药物发现

原文地址：http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型（如ChatGPT）的人工智能算法，这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配，而无需执行计算分子结

2023-06-13 11:48 News WIKI 相关搜索

AI“模型崩溃”风险需警惕

从客户服务到内容创作，人工智能（AI）影响了众多领域的进展。但是，一个日益严重的被称为“模型崩溃”的问题，可能会使AI的所有成就功亏一篑。“模型崩溃”是今年7月发表在英国《自然》杂志上的一篇研究论文指出的问题。它是指用AI生成的数据集训练未来几代机器学习模型，可能会严重“污染”它们的输出。多家外媒报

2024-09-25 11:47 News WIKI 相关搜索

DeepMind－AI模型预测天气又快又好

近日一项发表于《自然》的研究报道了谷歌DeepMind开发的首个天气预测人工智能（AI）模型——GenCast。该模型比目前运行中的最佳中期预报系统——欧洲中期天气预报中心的集合预报（ENS）更精准。GenCast在8分钟内就能完成15天的预测，而目前的预测程序需要几个小时。据介绍，包括ENS在内的

2024-12-06 10:58 News WIKI 相关搜索

用AI数据训练AI可能最终导致崩溃

《自然》7月24日发表的一篇论文指出，用人工智能（AI）生成的数据集训练未来几代机器学习模型可能会污染它们的输出，这个概念称为“模型崩溃”（model collapse）。该研究显示，原始内容会在数代内变成不相关的胡言乱语，显示出使用可靠数据训练AI模型的重要性。生成式AI工具越来越受欢迎，如大语言

2024-07-28 21:12 News WIKI 相关搜索

用AI数据训练AI可能最终导致崩溃

　　《自然》7月24日发表的一篇论文指出，用人工智能（AI）生成的数据集训练未来几代机器学习模型可能会污染它们的输出，这个概念称为“模型崩溃”（model collapse）。该研究显示，原始内容会在数代内变成不相关的胡言乱语，显示出使用可靠数据训练AI模型的重要性。　　生成式AI工具越来越受欢迎，

2024-07-30 16:53 News WIKI 相关搜索

AI视频生成模型Sora来了

原文地址：http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm

2024-02-18 22:07 News WIKI 相关搜索

释放AI大模型促消费潜力

今年的《政府工作报告》提出持续推进“人工智能+”行动，旨在抓住人工智能技术突破机遇，使我国数字技术与制造优势、市场规模优势充分结合，推动人工智能大模型广泛应用，真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下，AI大模型在激活内需市场、促进消费升级等方面充满“模”力。随着人工智能技

2025-04-07 14:47 News WIKI 相关搜索

AI模型助力精准诊断冠心病

近日，由上海市第一人民医院与联影智能的一项研究开发并验证一款可自动量化心肌血流状况的CT心肌灌注成像深度学习模型，辅助医生准确诊断患者心肌缺血程度，其衍生的缺血心肌体积百分比指数可作为预测不良心血管事件（以下简称MACE）发生概率的重要参考，能帮助医生预判患者发病几率，进而制定个性化治疗方案。相关论

2025-05-09 00:58 News WIKI 相关搜索

华为发布大模型时代AI存储新品

原文地址：http://news.sciencenet.cn/htmlnews/2023/7/504751.shtm

2023-07-14 21:49 News WIKI 相关搜索

AI模型可为癌症患者选择最佳疗法

科技日报讯（记者刘霞）来自澳大利亚国立大学、美国国家癌症研究所和Pangea Biomed制药公司的科学家，成功开发出一种人工智能（AI）模型“DeepPT”，可以帮助医生为癌症患者选择最佳疗法。相关研究论文发表于最新一期《自然·癌症》杂志。“DeepPT”通过预测患者的信使核糖核酸（mRNA）图

2024-07-11 14:51 News WIKI 相关搜索

AI模型搜寻癌症线索速度远超以往

质谱仪可以检测人体细胞中糖分子的不同结构。图片来源：马格努斯·戈坦德/伦德伯格研究基金会科技日报北京7月10日电（记者张梦然）瑞典哥德堡大学团队开发了一种人工智能（AI）模型，通过糖分析增加检测癌症的可能性。与当前的半手动方法相比，AI模型能在几秒钟内准确发现异常。研究结果发表在新一期《自然·方法

2024-07-11 12:25 News WIKI 相关搜索

AI新模型快速预测材料光学性质

未来的中央处理器（艺术图）。图片来源：美国趣味工程网站科技日报讯（记者刘霞）据美国趣味工程网站近日报道，日本东北大学和美国麻省理工学院科学家，成功开发出一款新人工智能（AI）模型GNNOpt。该模型能以与量子模拟相同的精度预测材料的光学性质，但速度能快100万倍。研究团队表示，这一重要进展有望加速

2024-10-12 11:16 News WIKI 相关搜索

模拟芯片大幅削减AI模型运行能耗

　　模拟计算机芯片运行人工智能（AI）语音识别模型的效率是传统芯片的14倍，有可能为AI研究中巨大且不断增长的能源消耗以及全球范围内通用数字芯片短缺问题提供解决方案。　　这一新产品由IBM Research开发，概述这项工作的论文发表于《自然》。研究人员声称，模拟芯片可以减少人工智能发展的障碍。　　

2023-08-30 17:41 News WIKI 相关搜索

模拟芯片大幅削减AI模型运行能耗

原文地址：http://news.sciencenet.cn/htmlnews/2023/8/507457.shtm

2023-08-29 18:25 News WIKI 相关搜索

Science：谷歌AI新模型预测天气快又准

原文地址：http://news.sciencenet.cn/htmlnews/2023/11/512459.shtm编译｜辛雨图片来源：Carlos Munoz Yague 人工智能（AI）公司Google DeepMind开发的机器学习模型GraphCast，在“3至

2023-11-16 22:43 News WIKI 相关搜索

AI大模型“源”炼造客服大脑

　　2018年至今，NLP领域经历了非常大的变化，Transformer、ELMO、BERT、GPT-3，再到最近的ChatGPT（GPT 3.5的微调）的突破，NLP在预训练大模型的暴力拆解路上越走越远，这也让各行业开始相信：很多之前无法做到的场景、效果，现在可以有新的解法和落地。　　智能客服，是

2022-12-30 16:38 News WIKI 相关搜索

AI大模型走出“泡沫期”未来何如

　　今年3月ChatGPT-4上线以来，国内科技龙头企业密集推出人工智能大模型，百度“文心一言”、阿里云“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场，呈现百花齐放、迅猛发展的态势。截至2023年10月初，国

2023-12-29 16:31 News WIKI 相关搜索

《自然》发文盛赞中国开源AI模型DeepSeek

最近，由来自杭州的“深度求索”初创团队开发的DeepSeek系列AI模型，引发了全球范围的关注。1月24日，知名学术期刊《自然》也发文关注该模型及相应产品，称“中国开发的大语言模型DeepSeek-R1以亲民价格和开放性挑战了OpenAI的推理模型GPT-o1的地位，令科学家们感到兴奋”。《中国科学

2025-02-07 18:26 News WIKI 相关搜索