OpenAI推出“数据伙伴关系”,减偏向缺陷

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512053.shtm·OpenAI宣布了“数据伙伴关系”计划,旨在与第三方机构合作,建立用于人工智能模型训练的公共和私有数据集。·OpenAI将收集“反映全人类社会”且目前不易在线访问的“大规模”数据集。该公司特别希望收集能“表达人类意图”的数据(如长篇写作或对话),这些数据将跨越不同的语言、主题和格式。训练人工智能模型的数据集存在严重缺陷,这是一个公开的秘密。比如图像语料库往往以美国为首的西方国家为中心,部分原因在于在编制数据集时,这些地方的图像在互联网中占据主导地位。模型则以有害的方式放大了这些缺陷。 ?OpenAI在官网公布,它希望与外部机构合作创建新的数据集来消除这些缺陷。当地时间11月9日,OpenAI在官网公布,它希望与外部机构合作创建新的数据集来消除这些缺陷。......阅读全文

OpenAI推出“数据伙伴关系”,减偏向缺陷

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512053.shtm·OpenAI宣布了“数据伙伴关系”计划,旨在与第三方机构合作,建立用于人工智能模型训练的公共和私有数据集。·OpenAI将收集“反映全人类社会”且目前不易在线访问的“大规模”数据集

OpenAI:愿与意监管机构合作加强数据保护

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497943.shtm OpenAI在与意大利监管机构的会议中,承诺提高个人数据使用的透明度。 当地时间4月6日,意大利个人数据保护局官网发布消息称,ChatGPT的开发公司OpenAI与该机构于5

面向跨模态遥感数据的生成式预训练大模型发布

以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中

针对微软?OpenAI推出ChatGPT计划

原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507419.shtm ·ChatGPT Enterprise由AI模型GPT-4提供支持,运行速度是ChatGPT付费版的两倍。新产品还在普通ChatGPT之上添加了“企业级”隐私和数据分析功能,以及

1/4临床试验数据造假,“致命缺陷”如何避免?

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/505817.shtm

大脑训练或有助改进注意力缺陷

  人们正在说什么来着?想起来了,大脑训练项目或有助于帮助注意力不集中的人聚焦日常生活中的目标任务。至少,这是一个特殊项目的研究意图所在。  这项新研究成果让两种相持不下的对立观点终于有一方得胜。此前有观点认为,没有充足的证据说明,训练大脑执行一项具体任务可以使认知能力获得较大范围的提升;而另一些人

美AI巨头被控秘密“侵吞”数据

人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。收集数据“走捷径”英国《泰晤士报》近日刊文指出

首届科学数据大会探讨“科研大数据与数据科学”

  2月24日,首届科学数据大会在中国科学院大学国际会议中心举行。包括中科院院士郭华东、陈润生,中国工程院院士汪懋华在内的400多名专家、青年科研人员参会。   中科院副院长、国际科技数据委员会(CODATA)中国全国委员会主席丁仲礼向会议发来贺信。他在贺信中表示,科研大数据和数据科学的作用越来越

GPT4很强大但仍有诸多谜团,OpenAI选择只透露这么多

“(该模型) 仍然存在很多问题和错误……但你确实可以看到微积分或法律等技能的飞跃,从某些领域的非常糟糕到相对于人类来说实际上相当好。 ”从长远来看,OpenAI计划构建和部署可以处理多种媒体的系统,包括声音和视频。“我们可以采用所有这些通用知识技能,并将它们传播到各种不同领域。这将技术带入了一个全新

定性数据和定量数据的区别

1、定义不同定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。2、所依赖的哲学体系不同作为定性数据,其对象是客观的

定性数据和定量数据的区别

1、定义不同定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。2、所依赖的哲学体系不同作为定性数据,其对象是客观的

定性数据和定量数据的区别

1、定义不同定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。2、所依赖的哲学体系不同作为定性数据,其对象是客观的

伯克利实验室AI成果:基于训练数据,提取细胞内部结构

  美国能源部劳伦斯伯克利实验室的数学家们,开发了一种针对实验成像数据的新的机器学习算法。与典型的机器学习算法需要成千上万的训练图像不同,这种新算法需要的训练图像少得多,而且速度也提高了不少。  伯克利实验室的能源高级数学研究与应用中心(简称CAMERA)的Daniël Pelt和James Set

小说作者起诉科技巨头英伟达侵犯版权训练AI平台

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518878.shtm这起诉讼将英伟达拖入了围绕生成式人工智能引发的越来越多的诉讼中。开发聊天机器人ChatGPT的OpenAI以及其他科技公司在美国面临多起来自版权所有者的诉讼,包括作家、视觉艺术家和音乐

大数据能否破解数据造假难题?

  林宣雄,1962年9月生,江苏宜兴人,西安交通大学环保大数据研究中心主任。1998年获陕西省优秀青年科技工作者称号,1999年主持研发的“国家环境监理信息系统”被确定为国家级火炬计划项目,同年获省优秀软件人才称号;2003年获首届省优秀青年科技创新奖;2008年承担环境保护部节能减排核心重大软件

分析数据的处理——可疑数据的取舍

1. Q-检验法 (3~10次测定适用,且只有一个可疑数据)  (1) 将各数据从小到大排列:x1, x2, x3……xn ;   (2)计算  (x大-x小),  即  (xn -x1);   (3)计算    ( x可-x邻),   (4)计算舍弃商  Q 计 =ô x可-x邻ô/ xn -x1

微软推出自制AI芯片,发布自定义AI助手平台

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512401.shtm名为Maia 100的AI芯片和名为Cobalt 100的中央处理器将为微软Azure数据中心提供算力。微软暂不打算对外出售这些芯片。微软还发布了新平台Copilot Studio,

直读光谱软件在查找数据时弹出数据

WinOE: Information! Maxmumdisplay limit has been reached.答:解决技巧:方法一:打开“我的电脑”C:/ARL-DATA/RESULTS将数据剪切到新建文件夹中退出即可;方法二:WinOEUtilitiesDatabases Res

月桂酸的分子数据和计算数据

分子数据1、 摩尔折射率:59.202、 摩尔体积(m3/mol):221.23、 等张比容(90.2K):531.34、 表面张力(dyne/cm):33.25、 极化率(10-24cm3):23.47计算数据1、 疏水参数计算参考值(XlogP):4.22、 氢键供体数量:13、 氢键受体数量:

《中国科学数据》:从根源唤醒沉睡的数据

  近年来,因“原始数据丢失,工作无法重复”造成的撤稿事件屡见不鲜。 2020年1月,2018年诺贝尔化学奖得主Frances H. Arnold撤掉了2019年5月发表在《科学》上的一篇论文,原因是缺失了关键的原始数据,致使研究成果无法重复。 “只发表论文不公开研究数据,可能会导致科学研究

推动人工智能产业快速发展要把保障数据安全放在突出位置

  美国人工智能公司OpenAI推出GPT Store,掀起AI应用新潮流;谷歌遭遇裁员风波,聚焦AI战略调整;特斯拉创始人埃隆·马斯克起诉OpenAI,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务……近期,人工智能领域大模型声势高涨,产品与服务推陈出新,但同时也伴随着诸多争议,尤其是在数

探头数据

技术数据 化学环境 光纤套管材料探头端部材料环氧树脂弱酸 石英/石英    +-ME     -MS  -PEEK  -PVC     ±+++316不锈钢PEEKPTFEHastelloyÒ C276镍合金-++++强酸 石英/石英    +-ME-MS-PEEK-PVC         -±+±

能源常用数据

一)几种燃料所含的能量   1吨(t)煤:7560千瓦小时(kWh)=27.2吉焦耳(GJ)   (1吉焦耳=109焦耳)   1立方米(m3)原油:10070千瓦小时(kWh)=36.3吉焦耳(GJ)   1立方米(m3木柴:1240千瓦小时(kwh)=4.5吉焦耳(GJ)   1吨(t)液化石油

闵应骅:大数据时代聊聊小数据

  现在好像人人都爱说“大数据”,就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个。可是我最近看《美国计算机学会通讯》(CACM)上面提到了几次小数据,我觉得大家也有必要了解一下这个有趣的概念。  什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突

聚焦数据资源:数据的共享应是有价的

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508337.shtm“社会要进步,数据应该共享。当然,数据共享应该是有价的共享,不应该是免费的共享。”“我们真正需要对话的是更多细节:我们共享的是什么数据?生成和共享的格式是什么?在多大程度上进行共享?在

福建上杭中止公布检测数据-污染数据算机密?

  紫金矿业污水事故发生后,福建上杭县环境监测站中止公布可能致癌的六价铬检测数据。上杭县官员表示,这个数据是机密(央视7月22日报道)。  按照《环境信息公开办法》,企业排放数据要长期公开,企业污染环境数据,环保部门也应该公开。但上杭县官方却违反法律与自身职责,打着“机

美国爆发“数据起义”,矛头直指ChatGPT

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504967.shtm美国圣克拉拉大学法学院教授埃里克·戈德曼认为,诉讼浪潮才刚刚开始,“第二波和第三波”即将到来,而这将定义人工智能的未来。人工智能公司辩解称,使用受版权保护的作品来培训人工智能是合理的—

ChatGPT涉嫌侵权?普利策奖得主提起诉讼

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508358.shtm 中新网9月12日电 据路透社报道,包括普利策小说奖得主迈克尔·夏邦(Michael Chabon)在内的几名美国作家,日前在旧金山联邦法院起诉美国人工智能公司OpenAI,指控其

抢抓AI发展先机,宁夏建成西部首个智算中心

  随着ChatGPT等AI通用大模型的爆发,智算已成为算力新的发展高峰,直接影响数字经济发展速度,决定社会智能发展高度。8月20日,记者从2023中国算力大会第二届西部数谷算力产业大会上获悉,宁夏主动把握产业变革机遇,建成西部首个面向市场的千卡级AI训练集群——中国移动(宁夏中卫)数据中心,可提供

ChatGPT火了!国内AI风往哪儿吹

  ChatGPT概念股火了!  连日来,美国人工智能(AI)实验室OpenAI发布的聊天机器人ChatGPT火爆全网,并带动了相关概念股的上涨。  在A股市场,资本大举炒作ChatGPT概念股,部分概念股出现五连板的走势。百度宣布将推出中国版的ChatGPT项目——文心一言(英文名ERNIE Bo