本文要点:笔者把像ChatGPT一样,利用从互联网上无偿地获取的数据及信息,通过概率方式人工智能技术快速地自动生成文本、图像、声音等数据及信息载体以满足客户需要的应用程序,统称为“无偿式概率式自动生成工具”。笔者认为,如果不对这类工具的使用实施限制并且规范相应法律法规,任其自由泛滥,必将破坏人类社会长期形成的认知逻辑准则,最终结果可能是导致人类的智能退化。
(如果您对本文上述主要观点厌恶,那么就请您不必继续看下文了。)
最近两个月来,人工智能领域最出风头的产品/应用/话题无疑是OpenAI面向全世界推出的“ChatGPT”,一款利用从互联网上无偿地获取的数据及信息,通过概率方式人工智能技术快速地自动生成文本,以回答提问者问题的“聊天机器人”。据报道,ChatGPT的注册用户已经超过一亿,在这么短的时间内能够获得如此众多的用户,其能力和效果应该是毋庸置疑的。
笔者把像ChatGPT一样,利用从互联网上无偿地获取数据及信息,通过概率方式人工智能技术快速地自动生成文本、图像、声音等数据及信息载体以满足客户需要的应用程序,统称为“无偿式概率式自动生成工具”(“无偿”指称其获取资源方式,“概率”指称其工作理论基础,并非所有的AIGC工具都具有这两个特征)。
首先申明,笔者完全无意反对AIGC工具的研发,甚至还期待着某天有某款AIGC工具被发明出来可以用于自动发现逻辑或数学的新定理(笔者本人工作在基于强相关逻辑演算的自动定理发现领域)。但是,笔者在这里关心的关键问题是,类似于ChatGPT这样的无偿式概率式自动生成工具,无论它们自动生成的是什么,如果任其自由发展和使用,将会给人类社会带来什么后果?
让我们先来引入一个概念。我们把从人类社会文化中历史上、现今以及今后产生的一切原生数据及知识通过数字化方法(包括各种标注方法)输入到互联网上的数据统称为“原始数据”;把以原始数据为资源使用无偿式概率式自动生成工具自动生成的数据称为“第一代衍生数据”;把以第n代衍生数据为资源使用无偿式概率式自动生成工具自动生成的数据称为“第n+1代衍生数据”。
毋庸置疑,尽管今后原始数据还会不断地增加,但是伴随着计算机硬件技术的发展,超大规模数据的存储和加工,超大规模的算力,超大模型的研发,无偿式概率式自动生成工具的超大规模使用,迟早有一个时间点(或许眼下的现在已经过了此时间点也未可知,笔者未做调查),互联网上的衍生数据量将超越原始数据量,并且在超越之后两者间的数量差距更会急速增大,直到原始数据量和衍生数据量相比显得微乎其微。笔者的问题是:在彼时,人类社会的认知逻辑准则何在?
笔者认为,人类社会长期形成的认知逻辑准则之一是:“凡物必有其所值”。一般而论,“优秀上乘”将永远保持其质量,如果某人某物被世人评价为“优秀上乘”,那么这个评价(价值)一般会持续下去,并且这个评价(价值)是针对该人或者产出该物的人的特定个人素质及能力的。至少在目前的人类社会,特定个人素质及能力的培养或获得,是需要付出相应代价,并非任何人都可以轻易具备的。这部分代价,也计入在“凡物必有其所值”中。这一认知逻辑准则是人类社会文化中对文学、绘画、音乐等艺术作品,对科学发现、技术发明、学术著作等科技作品,实施著作权或知识产权保护的逻辑基础。尽管对艺术作品或科技作品的模仿、抄袭、剽窃、伪造等行为也与人类社会道德准则有关,但是其根本还是上述认知逻辑准则。
可以试想这样的场景:当看到一幅画作涂了个“乱七八糟”时,不知者可能觉得毫无价值没什么了不起,但是,当获知该画作是抽象派大师毕加索的作品时,认知就应该完全两样了。类似的场景也可能发生在对贝多芬的不太周知的音乐作品的欣赏评价之时。这就是人类社会长期形成的认知逻辑准则在起作用。(蛇足一句,当今中国科技界通常所说的“人才帽子”作用,其背景也应该是认知逻辑准则。)
举个实例。众所周知,对照片的PS技术已经颠覆了人类社会对照片的认知逻辑准则。在没有PS技术的年代,看到一张照片,常人首先想到的是从美学观点或历史观点如何欣赏,摄影工作者/爱好者则可能会从摄影技术角度去欣赏和评价。如今呢,大概几乎所有知道PS技术的人看到一张照片后都首先会想到它是否是P出来的,如何P出来的。如何准确地判定一幅照片的真实程度以确定其是否可以被采用为法律证据,甚至已经成为公检法三方的(由PS技术生出的)难题。但是,现在,对于使用无偿式概率式自动生成工具自动生成的照片,已经无法想象其“原本的照片”了。
对于ChatGPT的横空出世及超速普及,现在世界上许多行业对于ChatGPT的无节制使用所能造成的在本行业内的后果之担心甚至恐惧,应该还仅仅是初步的表面的。
笔者认为,从人类社会将来发展进步(退步也未可知)的角度来思考,我们至少应该考虑下面这些问题:
(1)蒸汽机为人类带来动力,汽车/飞机为人类带来运输,计算机为人类带来计算,ChatGPT等工具们为人类带来的是什么?有人说是“创造”,真的是“创造”吗?
(2)进入计算机/互联网时代之前,人类经历了数千年的进化与发展,积累了相当数量的数据及知识。这些被数字化为“原始数据”的人类原生数据及知识,是ChatGPT等工具们赖以成功的根本。ChatGPT等工具们的无节制使用,是会增加人类原生数据及知识的积累速度,还是会减少人类原生数据及知识的积累速度?
(3)在互联网上的衍生数据量远超原始数据量之时,ChatGPT等工具们所生成的可能是若干代衍生数据。面对这样的数据成分构成,人类社会长期形成的认知逻辑准则是否还能继续维持而不被扬弃,还能起作用?还是人类社会将会形成新的认知逻辑准则?
笔者认为,如果不对无偿式概率式自动生成工具的使用实施限制并且规范相应法律法规,任其自由泛滥,必将破坏人类社会长期形成的认知逻辑准则,最终结果可能是导致人类的智能退化。
11月7日,河南省工业和信息化厅发布2025年国家人工智能产业及赋能新型工业化创新任务揭榜挂帅工作的通知。其中,“人工智能+制造”中,钢铁制造大模型揭榜任务:面向钢铁制造流程高效有序运行需求,深度融合......
工业和信息化部近日印发《关于开展2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅工作的通知》,正式启动相关创新任务揭榜挂帅工作。据了解,本次揭榜挂帅工作聚焦人工智能产业发展底座、“人工智能+制造......
化学是一门研究物质组成、结构、性质与变化规律的学科,其发展史是人类突破自然表象、揭示物质本质的历史。从古代炼金术士对“点石成金”的痴迷,到现代科学家操控原子合成新物质,在好奇心的驱动下,人类正不断向着......
一、文件制订背景近年来,党中央、国务院高度重视人工智能发展,2025年8月国务院印发《关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号),要求探索推广人人可享的高水平居民健康助手,有序推......
国家卫生健康委办公厅、国家发展改革委办公厅等五部门发布关于促进和规范“人工智能+医疗卫生”应用发展的实施意见通知。国卫办规划发〔2025〕30号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、发展改......
10月31日,中国科学院第四届职工技能大赛人工智能领域比赛决赛在中国科学院自动化研究所成功举办。院直属机关党委常务副书记、院工会主席房自正,院直属机关党委副书记、院工会常务副主席杨旭,自动化研究所所长......
工业和信息化部党组书记、部长李乐成在《党建》杂志发表署名文章《加快推进人工智能赋能新型工业化》。文章指出,“面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导......
2025年世界科技与发展论坛虽已落下帷幕,“人工智能促进科技与发展”的主题仍在全球科技界激荡回响。在业界看来,这场论坛不仅展现了中国智造的技术硬实力,更清晰传递出一个核心信号:“开放合作”的包容姿态与......
近日,由中国科学技术协会主办的2025年世界科技与发展论坛在北京举行。作为中国科协“开放合作月”重要活动之一,本届论坛以“人工智能促进科技与发展”为主题,围绕人工智能与未来产业、开放科学与全球合作等四......
近日,记者从清华大学丘成桐数学科学中心获悉,该中心副教授周源与清华大学智能产业研究院、电子工程系副教授马剑竹合作,提出了一个可从观测数据中自动推导出空间物理规律的神经符号模型——PhyE2E(Phys......