“弱智吧”帖子训练AI效果遥遥领先?研究团队回应

白岳霖和他的小伙伴们实在想不到,他们最近做的中文指令微调数据集,会因为使用了百度贴吧“弱智吧”的帖子相关数据而火爆“出圈”。白岳霖是中国科学院深圳先进技术研究院三年级硕士生。他的团队在题为“COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning”的研究中,使用“弱智吧标题+GPT-4回答”微调后的大模型评估结果,超过了他们收集的其他有监督微调(SFT)指令集数据。后者来自包括知乎、百科、豆瓣、小红书等社交平台。对此,业内人士表示“看论文看到哈哈大笑”。网友纷纷跟帖评论:“这把‘弱智吧’上大分”“大智若愚”“‘弱智吧’才是人类面对AI的最后一道堡垒”。“没想到这个工作‘出圈’了,但网上存在一些错误解读,比如有人拿这个研究调侃‘知乎不如弱智吧’。”作为论文共同第一作者,白岳霖告诉《中国科学报》,这篇文章的作者来自国内外多个顶尖机构,“考虑到团队学术......阅读全文

论文突破200万篇后,arXiv却渐失人心?

2022年伊始,预印本服务器arXiv收获了一份新年大礼,全球科学家通过其发布的论文突破了200万篇。本该是庆贺时刻,但《科学美国人》(Scientific American)却发了一篇负面报道,分析了arXiv当下暴露出的诸多问题,引起科学界热议。中国作为世界上论文数量产出最多的国家,arXiv的

发布超200万篇论文后,arXiv丢了初心吗

2022年伊始,预印本服务器arXiv收获了一份新年大礼,全球科学家通过其发布的论文突破了200万篇。本该是庆贺时刻,但《科学美国人》(Scientific American)却跟进一篇报道,分析了arXiv当下暴露出的诸多问题,引起科学界热议。中国作为世界上论文数量产出最多的国家,arXiv的重要

涉清华北大等多单位合作的文章被指抄袭调查结果出炉

  随着深度学习的快速发展,为多个下游任务训练大模型(BM)成为一种流行的范式。研究人员在BMs的构建和BM在多个领域的应用方面取得了多方面的成果。目前缺乏梳理BMs整体进展并指导后续研究的研究工作。  2022年3月26日,清华大学、东北大学、纽约大学、北京大学、哥伦比亚大学、哈尔滨工业大学、北京

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

“弱智吧”帖子训练AI效果最好?作者回应

白岳霖和他的小伙伴们实在想不到,他们最近做的中文指令微调数据集,会因为使用了百度贴吧“弱智吧”的帖子相关数据而火爆“出圈”。白岳霖是中国科学院深圳先进技术研究院三年级硕士生。他的团队在题为“COIG-CQIA: Quality is All You Need for Chinese Instruct

“弱智吧”帖子训练AI效果遥遥领先?研究团队回应

白岳霖和他的小伙伴们实在想不到,他们最近做的中文指令微调数据集,会因为使用了百度贴吧“弱智吧”的帖子相关数据而火爆“出圈”。白岳霖是中国科学院深圳先进技术研究院三年级硕士生。他的团队在题为“COIG-CQIA: Quality is All You Need for Chinese Instruct

全国首个DNA存储领域预训练大模型“ChatDNA”发布

近年来,DNA 和人工智能一直都是科技发展的热门议题。随着科学技术的进步,它们之间便有了无限的可能性。例如,DNA 和人工智能可以帮助我们更快地研究特定基因组的变异和功能。科学家可以使用人工智能算法来分析大量的 DNA 序列,从而发现有价值的变异和基因功能,为疾病的治疗提供线索。DNA 是生物世界中

首个万字创作大模型“中文逍遥”在京发布

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510212.shtm

高文:将训练大模型底座面向全社会开放

·高文表示,开发大模型不是拍脑袋、喊口号那么容易,而是必须拥有算力,只有投入几十亿元甚至上百亿元才能做出“像样的东西”,但这笔资金对于高校和初创企业而言是一个门槛。“我们基本的想法就是用鹏城实验室的算力、公开渠道的数据,训练出大模型底座面向全社会开放,供研究人员、创业者使用。”5月22日,中国工程院

面向跨模态遥感数据的生成式预训练大模型发布

以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中

预训练模型创业渐入佳境

2月10日,创新工场在京宣布,北京澜舟科技公司已完成近亿元Pre-A轮融资,此次融资由联想创投、斯道资本共同领投,创新工场跟投。本轮融资澜舟科技将主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。澜舟科技的新一轮融资,是时下围绕人工智能预训练大模型的创新创业渐入佳境的生动体现。在澜舟科技创始

欧洲核子中心“新粒子”引发论文潮

  欧洲核子研究中心的大型强子对撞机(LHC)可能找到了一种新的粒子,这种诱人的“可能”让理论物理学家的论文在短短两周内如潮水般涌出。   据《自然》期刊官网消息,12月15日欧洲核子研究中心的科学家宣布了他们的新发现,自那以后,论文预印本平台arXiv已经发布了95篇专门讨论这种假想新粒子的研究论

谷歌深度思维推出自我训练“机器猫”,可快速学习新任务

  谷歌“深度思维”公司研究人员最近将人工智能与一款名为“机器猫”的机器人结合起来,预计它将在自我训练机器人的世界中实现一大飞跃。利用大型语言模型背后的相同技术研发的“机器猫”,不仅可快速学习新任务,还可通过构建自己的性能数据来提高性能。研究论文发表在预印本服务器arXiv上。  到目前为止,机器人

知名预印本服务器删除“争议”超导论文

富氢超导体是在一种叫做金刚石砧电池的高压装置中合成的。图片来源:MAX ALEXANDERS/SCIENCE SOURCE一场关于常温超导的争论已经进入了科学出版领域。据《科学》报道,近期,预印本服务器arXiv管理员删除了来自常温超导研究者的几篇论文,称他们的稿件含有煽动性内容和不专业的语言。Ar

谷歌推出自我训练“机器猫”,可快速学习新任务

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503738.shtm   ?人工智能与“机器猫”结合,可快速学习新任务。图片来源:深度思维科技日报北京6月28日电 (记者张梦然)谷歌“深度思维”公司研究人员最近将人工智能与一款名为“机器猫”的机

南开新成果可让Sora核心组件训练提速10多倍

2024年伊始,人工智能大模型ChatGPT母公司Open AI发布首个人工智能文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车”视频中可以看出,AI仍然存在着无

算法自动“划重点”---AI学会“抱佛脚”

预训练模型的兴起给自然语言处理(NLP)带来了“新面貌”。    近年来,Google、Facebook、OpenAI、微软、百度等人工智能“头部玩家”推出多个颇具影响的预训练模型,并反复迭代出十多个版本。无论学术界还是业界,人们对大规模预训练模型“热情高涨”。    日前,来自清华大学的一

独特视角:从物理智能到微波视觉(五)

用于训练样本的SAR图像往往并不充分,笔者提出基于生成网络的零样本学习方法,采用生成网络来层次化表征SAR图像特征,由此构建连续的可解释的特征空间,通过将SAR图像映射到该特征空间来实现对于未知样本的解译[21]。图14(a)为深度生成网络架构,由构造网络、生成网络和解译网络3部分组成,分别进行从已

因学术争议发起网络论战,结果他被禁言了

  最近,加州大学圣地亚哥分校的理论物理学家Jorge Hirsch很郁闷。  他因为与同行在室温超导性问题上的争论,被预印本网站arXiv禁言了。在长达6个月的时间里,他将无法在该网站发表论文。  Hirsch认为该禁令“非常不公平”,而且对他的研究有很大影响,“如果我不能发表论文,我就无法工作。

让Sora提速10多倍,南开团队开源MDTv2

南开新闻网讯(记者 高雨桐)2024年伊始,Open AI(美国开放人工智能研究中心)公司发布首个AI(人工智能)文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车

“华大智造津渡生科医学大模型创新中心”落成

  6月18日,深圳津渡生物医学科技有限公司与华大智造举行了揭牌仪式,并正式宣布“华大智造-津渡生科医学大模型创新中心”在津渡生科落成。双方将携手在医学诊断、人工智能等领域展开深入合作。  双方将基于华大智造DNBSEQ-G99平台,通过津渡生科超低测序量筛查算法,大幅扩充G99平台可检测的疾病门类

电子预印本文献库论文数破百万

   1991年,Paul Ginsparg成立 arXiv。图片来源:《自然》  arXiv.org是一个非常流行的预印本文献库。物理学家、数学家和计算机科学家通常会将论文草稿上传至该文献库,以便在同行评议前公开分享他们的研究发现。如今,该文献库已拥有100万余篇研究论文。  1991年8月,ar

超快人工智能首次预测全球空气污染

日前,微软开发的人工智能模型可以在不到一分钟时间内准确预测全球空气污染,甚至还能快速预测全球10天内的天气。天气预报正受益于人工智能的蓬勃发展。图片来源:NESDIS/STAR/NOAA/Alamy该模型名为Aurora,是科技巨头正在开发的一系列人工智能天气预报工具之一,包括谷歌DeepMind的

超快人工智能首次预测全球空气污染

日前,微软开发的人工智能模型可以在不到一分钟时间内准确预测全球空气污染,甚至还能快速预测全球10天内的天气。天气预报正受益于人工智能的蓬勃发展。图片来源:NESDIS/STAR/NOAA/Alamy该模型名为Aurora,是科技巨头正在开发的一系列人工智能天气预报工具之一,包括谷歌DeepMind的

星系形成与演化研究取得系列进展

  中国科学院紫金山天文台研究员康熙,博士生王亮所在的中徳马普青年伙伴小组和德国马普天文所Andrea Maccio’率领的团组在星系形成的流体数值模拟研究方面取得新成果,系列文章(7篇论文)相继被英国《皇家天文学会月刊》(Monthly Notices of the Royal Astronom

英国科学家开发出新的同行评审平台

   英国萨塞克斯大学天体物理学家Peter Coles最近开发了一款低成本的同行评审平台,该平台可以绕过传统科学出版机构。Peter Coles把此平台软件开源,并鼓励其他领域科学家也这样做。  科研人员可以将他们发表在arXiv上的论文直接提交给《开放天体物理学杂志》,同时启动同行评审,通过同行

拿纱布、抓针头,英伟达与多所高校合作,开发手术机器人

  英伟达(NVIDIA)正与学术研究人员合作,研究手术机器人。  NVIDIA 联合多伦多大学、加州大学伯克利分校、苏黎世联邦理工学院和佐治亚理工学院的研究人员开发了 ORBIT-Surgical,一个训练机器人的模拟框架,可以提高手术团队的技能,同时减少外科医生的认知负担。  受腹腔镜手术(又称

四足机器人“自学”成出色守门员

原文地址:http://news.sciencenet.cn/htmlnews/2022/10/488397.shtm 科技日报北京10月27日电 (记者张梦然)美国加州大学伯克利分校、西蒙弗雷泽大学和乔治亚理工学院的联合机器人团队最近创建了一种强化学习模型,能让四足机器人以守门员的身份高效踢足

大模型又整活,照片也能唱歌说话

文 | 《中国科学报》记者 赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马俑,还有蒙娜丽莎、奥黛丽·赫本、孔子、鲁迅……只要一张照片和一段音频,他们就能开口说话、唱歌、

快跑比爬坡更易损伤小腿胫骨

快跑和爬坡,哪一项运动更容易损伤小腿胫骨?据近日发表在预印服务器arXiv上的一篇论文,加拿大和美国的一个研究团队发现,与上坡或下坡相比,在快速跑步时可能面临更大的胫骨骨折风险。  跑步时,双脚反复撞击地面的运动过程可能会导致胫骨夹板,甚至是胫骨骨折。研究人员知道,当跑步者增加训练强度时,这些损伤经