学术论文正被高价出售给大模型训练,作者却零收入
·越来越多的学术出版商正将研究论文卖给科技公司用以训练人工智能(AI)模型,而作者收入为零。大语言模型(LLM)因训练数据问题再次引发争议。日前,国际著名期刊《自然》(《Nature》)杂志编辑伊丽莎白·吉普尼(Elizabeth Gibney)发布一篇题为《你的论文被用来训练人工智能模型了吗?几乎可以肯定》一文。文中作者表示,当前有越来越多的学术出版商正在将研究论文授权给科技公司,用于训练人工智能(AI)模型。有学术出版商借此赚取了2300万美元,而作者却收入为零。这些交易在很多情况下并未征求作者的意见,引发了部分研究人员的强烈不满。“如果你的论文还没有被用作AI训练数据,很可能很快就会成为训练的一部分。”伊丽莎白·吉普尼在文中指出,当前学术论文作者在面对出版商出售其版权作品时几乎无权干涉。对于公开发表的文章,也没有现成机制来确认这些内容是否被用作AI训练数据。在大语言模型使用中,如何建立更加公平的机制保护创作者的权益,值得学......阅读全文
学术论文正被高价出售给大模型训练,作者却零收入
·越来越多的学术出版商正将研究论文卖给科技公司用以训练人工智能(AI)模型,而作者收入为零。大语言模型(LLM)因训练数据问题再次引发争议。日前,国际著名期刊《自然》(《Nature》)杂志编辑伊丽莎白·吉普尼(Elizabeth Gibney)发布一篇题为《你的论文被用来训练人工智能模型了吗?几乎
OpenAI打包新闻集团版权训练大模型
ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP
全国首个DNA存储领域预训练大模型“ChatDNA”发布
近年来,DNA 和人工智能一直都是科技发展的热门议题。随着科学技术的进步,它们之间便有了无限的可能性。例如,DNA 和人工智能可以帮助我们更快地研究特定基因组的变异和功能。科学家可以使用人工智能算法来分析大量的 DNA 序列,从而发现有价值的变异和基因功能,为疾病的治疗提供线索。DNA 是生物世界中
高文:将训练大模型底座面向全社会开放
·高文表示,开发大模型不是拍脑袋、喊口号那么容易,而是必须拥有算力,只有投入几十亿元甚至上百亿元才能做出“像样的东西”,但这笔资金对于高校和初创企业而言是一个门槛。“我们基本的想法就是用鹏城实验室的算力、公开渠道的数据,训练出大模型底座面向全社会开放,供研究人员、创业者使用。”5月22日,中国工程院
大模型训练遇“算力荒”,“超智融合”来帮忙
论及当下计算技术的发展方向和趋势,“超智融合”当仁不让——在今年6月发布的2024年全球“最节能超算”榜单(Green500)上,位列榜单前三的超算都采用了“超智融合”的技术理念。超智融合,顾名思义,意即“采用融合架构,集成超算和智算的功能”。在当前大模型训练不断需要大算力支持的时代背景下,超智融合
面向跨模态遥感数据的生成式预训练大模型发布
以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中
预训练模型创业渐入佳境
2月10日,创新工场在京宣布,北京澜舟科技公司已完成近亿元Pre-A轮融资,此次融资由联想创投、斯道资本共同领投,创新工场跟投。本轮融资澜舟科技将主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。澜舟科技的新一轮融资,是时下围绕人工智能预训练大模型的创新创业渐入佳境的生动体现。在澜舟科技创始
用AI生成数据训练AI或导致模型崩溃
科技日报北京7月25日电 (记者张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野
用AI生成数据训练AI或导致模型崩溃
《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练
《自然》封面:以AI生成数据训练AI,模型变傻?
大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”—— 近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡
《自然》封面:以AI生成数据训练AI,模型变傻?
大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡言乱语”
面对大模型应用门槛高-如何大模型发挥更大价值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?
闭合式四肢骨折固定训练模型功能解析
知能医学模型供应的这款闭合式四肢骨折固定训练模型以成年男性躯体为基准,在模型的上肢前臂和下肢小腿上预设了骨折创伤,可供学员了解人体骨折时所具备的反常运动、成角畸形、活动后产生骨擦音,骨折上下肢需及时用夹板固定,防止反复活动造成骨折周围血管神经损伤等现象,可用于练习骨折复位方法及骨折固定的方法。功能特
抢抓大模型行业机会
机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄 今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从
AI大模型“拿捏”电池寿命
作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还
讯飞联手华为攻克全国产算力下推理模型训练难关
1月15日,科大讯飞发布了我国“全国产”算力平台第一个深度推理大模型——讯飞星火X1。据公开测试,该模型中文数学能力表现突出,目前已应用于教育、医疗等场景。在大模型研发领域,讯飞星火坚持走全国产化路线。据科大讯飞研究院副院长殷兵介绍,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携
厦大尝试AI大模型破译甲骨文
近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文
Frontiers in Physiology:大重量训练有助于肌肉力量的提升
--最近来自Nebraska-Lincoln大学的一项研究表明,对于身体的强健程度来说,肌肉的发达程度与控制肌肉的神经元的健康程度同样重要。 过去四年以来,研究者们已经发现"小重量,多次数"的训练方式能够与"大重量,低次数"的训练方式达到相当的效果。尽管如此,选择大重量的人群的肌肉力量实际上要
大模型热要多点冷思考
行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。 用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示
首个量子领域大模型上线了!
百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。 据介绍,百度量子领域大模型将充分发挥技术协同效应,并提升现有大模型在训练速度、模型性能、交互效率等各个方面的能力。
释放AI大模型促消费潜力
今年的《政府工作报告》提出持续推进“人工智能+”行动,旨在抓住人工智能技术突破机遇,使我国数字技术与制造优势、市场规模优势充分结合,推动人工智能大模型广泛应用,真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下,AI大模型在激活内需市场、促进消费升级等方面充满“模”力。 随着人工智能技
中科闻歌发布雅意大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502201.shtm
“大模型不是万能的”
“大模型不是万能的,不能过度神话它。”这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在“CCF太原大模型赋能文物古建保护与传承论坛”上。自2022年底OpenAI推出大语言模型产品ChatGPT以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,喊出了“所有
北京加快大模型应用落地见效
7月1日,2024全球数字经济大会人工智能专题论坛在中关村国家自主创新示范区会议中心举办。记者从论坛获悉,北京已发布的大模型产品有71个,约占全国一半,人工智能产业高地建设成效显著。未来,北京将加快实现大模型应用落地见效。人工智能在数字经济产业发展中具有很强的“头雁”效应,以大模型为代表的生成式人工
伏羲系列气象大模型2.0面世
中新社上海6月3日电 (记者 陈静)3日,“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式在上海举办。全新升级、面向产业应用的伏羲系列气象大模型2.0(下文简称:“伏羲”2.0)面世,以“伏羲”2.0为核心的智能气象创新生态联盟同期成立。“伏羲”是人工智能驱动的次季节尺度气象大模型,可提供42
压缩算法为大语言模型“瘦身”
据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求
嗅觉训练能成为新的大脑训练吗?
随着年龄的增长,我们的嗅觉能力经常出现问题(称为嗅觉障碍)。老年人可能无法识别一种气味或将一种气味与另一种区分开来。在某些情况下,他们可能根本无法察觉气味。气味识别困难在患有神经退行性疾病的人身上很常见,包括老年痴呆症。 在没有已知医学原因的情况下,嗅觉受损可能是认知能力下降的一个预测因素。据
国内首个渔业大模型范蠡大模型1.0发布
6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。 范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构
国内首个渔业大模型范蠡大模型1.0发布
6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构共同研发
大模型加速改变云计算行业规则
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498365.shtm