DeepSeek新发布的AI模型会“报错家门”?日前,有网友发现,在向DeepSeek-V3模型提问“你是谁”时,DeepSeek-V3似乎将自己识别为ChatGPT。
有网友在向DeepSeek-V3模型提问“你是谁”时,DeepSeek-V3将自己识别为ChatGPT 来源:社交媒体截图
在进一步提问DeepSeek API的问题,它回答也是如何使用OpenAI API的说明,甚至讲了一些与GPT-4一模一样的笑话。有网友发出疑问,“DeepSeek是否在ChatGPT生成的文本上进行了训练?”
DeepSeek-V3是由国内知名量化资管巨头幻方量化创立的杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)最新发布的全新系列模型,由于这款模型总训练成本低,性价比高,发布后不少网友称其为“国产之光”,且有“AI界的拼多多”之称。但在发布后的一天,便出现了上述疑似“翻车”现象。
截至发稿前,深度求索公司尚未对此进行回应。但目前再次向DeepSeek-V3模型提问“你是谁”时,模型问答已恢复正常。
DeepSeek-V3并不是第一个混淆自己的模型。科技媒体TechCrunch报道,此前谷歌的AI模型Gemini在被使用中文提问你是谁时,也回答自己是百度的文心一言。
国内一家智能科技公司的技术负责人向澎湃科技记者分析时认为,DeepSeek-V3有可能直接将在ChatGPT生成的文本上作为训练基础,在训练过程中,该模型可能已经记住了一些GPT-4的输出,并正在逐字复述这些内容。
另有业内人士指出,目前互联网大模型优质数据训练集有限,训练过程中不可能没有重合,但是否构成抄袭也很难定义。即便“站在了ChatGPT巨人肩膀上,但成本降下来是真的”。
不过,直接在ChatGPT生成的文本上训练DeepSeek-V3也并不奇怪,前述智能科技公司技术负责人指出,拿GPT的回答作为数据集训练自有模型在国内很常见,“这种不用抓取数据,并且能够额外做数据处理,能节省时间、人力和训练成本。”训练一个大模型需要吞噬海量数据,耗尽了世界上所有容易获取的数据。
TechCrunch在报道中分析认为,造成这类现象的原因在于,目前互联网(AI公司获取大量训练数据的地方)正充斥着AI垃圾。生成式人工智能大模型在互联网数据上进行训练,而这些数据虽然信息丰富,但也充斥着不准确的内容,其中不乏“胡言乱语”。ChatGPT、Copilot和Gemini等AI工具都会为用户提供看似真实但却是捏造的数据。
另据欧洲联盟执法机构的一份报告指出,到2026年,网络内容中可能有90%是由人工合成生成的。报告预测,这种数据“污染”,使得从训练数据中彻底过滤AI生成内容变得非常困难。
(原标题:DeepSeek把自己误认成了ChatGPT?分析人士:或用了GPT生成文本做训练数据)
5月15日,湖北省市场监管局在武汉市举行2025年度工业产品生产许可获证企业“双随机、一公开”监督检查启动仪式。启动仪式现场使用产品质量监管信息系统抽取了12类100家检查对象和辅助检查的技术专家。这......
4月1日,记者从深圳海关获悉,其自主研发的智能查验机器人已引入海关系统全国首个“满血版”DeepSeek-R1,实现技术升级,并在进口危化品监管和水果通关领域形成示范。智能查验机器人正在现场作业。受访......
新年伊始,杭州深度求索人工智能基础技术研究有限公司(以下简称深度求索公司)推出的大语言模型DeepSeek以其杰出表现,迅速火遍全网,并引发全球关注。随着关注热度的持续升温,人们不禁想知道,为何Dee......
近日,遵义医科大学附属医院成功接入DeepSeek,完成院内本地化部署。这一举措标志着该院在智慧医疗领域迈出了坚实有力的一步,将为医疗服务质量带来新的提升。如何让人工智能更好地服务百姓健康,让数据“多......
从医渡科技科技,医渡AI中台的朋友圈又添新成员。上海市肺科医院最新完成DeepSeek本地化部署,还将接入医渡AI中台,与“AI医疗大脑”YiduCore组队,提升医疗管理效能。此前,“YiduCor......
近阶段以来,人工智能、DeepSeek等持续成为焦点话题,由此带来的中国资产价值重估也引发广泛讨论。全国人大代表,TCL创始人、董事长李东生在近日接受记者群访时表示,从整体来看,中国科技制造业具备性价......
记者从华南理工大学获悉,基于学校“成务”科学计算平台,该校开展大模型的本地化部署,于2月22日正式上线满血版DeepSeek-R1(671B),并面向广东省内其他院校开放。相较于蒸馏版模型,华南理工大......
“DeepSeek来了之后,不仅是自动驾驶,新能源汽车领域的‘人工智能+’会全面爆发,它的影响将贯穿到汽车设计、制造、销售、维保等汽车全产业链。”2月25日,在中国电动汽车百人会论坛(2025)专家媒......
2月21日,记者从深圳大学获悉,该校大数据系统计算技术国家工程实验室、信息中心联合华为,基于昇腾平台部署的满血版DeepSeek-R1(671B)大模型已正式上线,旨在为全校师生提供高效、稳定的本地化......
近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在......