发布时间:2023-03-20 17:50 原文链接: 斯坦福大学复制出ChatGPT人工智能训练成本不到600美元

斯坦福大学的Alpaca人工智能在许多任务上的表现与惊人的ChatGPT相似--但它建立在一个开源的语言模型上,训练成本不到600美元。看来这些神一样的人工智能已经便宜得吓人了,而且很容易复制。

六个月前,只有研究人员和博学者在关注大型语言模型的发展。但去年年底ChatGPT的推出震惊了世界:机器现在能够以一种与人类几乎没有区别的方式进行交流。它们能够在几秒钟内写出文本,甚至是跨越一系列令人眼花缭乱的主题领域的编程代码,而且往往是非常高的质量标准。正如GPT-4的推出所表明的那样,它们正在以流星般的速度进步,它们将像其他技术一样从根本上改变人类社会,因为它们有可能将一系列工作任务自动化--特别是在白领工人中,人们以前可能认为这是不可能的。

许多其他公司--特别是Google、苹果、Meta、百度和亚马逊等--也不甘落后,它们的人工智能很快就会涌入市场,附着在各种可能的应用和设备上。如果你是Bing的用户,语言模型已经出现在你的搜索引擎中,而且它们很快就会出现在其他地方。它们将出现在你的车里、你的手机里、你的电视上,当你试图给一家公司打电话时,它们会在电话的另一端等待。过不了多久,你就会在机器人中看到它们。

有一点值得安慰的是,OpenAI和其他这些大公司都意识到这些机器在垃圾邮件、错误信息、恶意软件、有针对性的骚扰和其他各种大多数人都认为会使世界变得更糟的使用情况方面的疯狂潜力。他们花了好几个月的时间在产品发布前手动削减这些能力。OpenAI首席执行官萨姆-奥特曼(Sam Altman)是许多担心政府行动不够迅速的人之一,没有以公共利益的名义为人工智能设置围栏。

但是,你可以花600美元自己建立一个语言模型呢?斯坦福大学的一个研究小组已经做到了这一点,其令人印象深刻的表现突出了整个行业及其令人敬畏的能力可能会迅速失去控制。

斯坦福大学的一个研究小组从Meta的开源LLaMA 7B语言模型开始--这是现有几个LLaMA模型中最小和最便宜的。在一万亿个"tokens"上进行预训练,这个小语言模型有一定的能力,但它在大多数任务中会明显落后于ChatGPT;GPT模型的主要成本,甚至主要竞争优势,主要来自OpenAI在后期训练中投入的大量时间和人力。读了十亿本书是一回事,但通过大量的问答式对话来教导这些AI的实际工作是另一回事。

因此,随着LLaMA 7B模型的建立和运行,斯坦福大学的团队基本上要求GPT采用175个由人类编写的指令/输出对,并开始以同样的风格和格式生成更多的指令/输出对,每次20个。这是通过OpenAI提供的一个有用的API自动完成的,在很短的时间内,该团队有大约52000个对话样本,用于后期训练LLaMA模型。生成这些大量训练数据的成本不到500美元。

然后,他们用这些数据来微调LLaMA模型--这个过程在8台80GB的A100云处理计算机上花了大约3个小时,这又花费了不到100美元。

xEOJK0zP.jpg

xEOJK0zP.jpg© 由 cnBeta.COM 提供

斯坦福大学团队使用GPT-3.5给LLaMA 7B提供了一套关于如何完成其工作的指令

接下来,他们对产生的模型进行了测试,他们称之为Alpaca,与ChatGPT的底层语言模型在各种领域(包括电子邮件写作、社交媒体和生产力工具)进行对比。在这些测试中,Alpaca赢得了90项,GPT赢得了89项。

"鉴于模型规模小,指令跟随数据量不大,我们对这一结果相当惊讶,"该团队写道。"除了利用这个静态评估集,我们还对Alpaca模型进行了交互式测试,发现Alpaca在不同的输入集上往往表现得与text-davinci-003 [GPT-3.5]类似。我们承认,我们的评估在规模和多样性方面可能是有限的"。

该团队表示,如果他们寻求优化过程,他们可能会更便宜地完成这项工作。值得注意的是,任何希望复制人工智能的人现在都可以获得能力更强的GPT 4.0,以及几个更强大的LLaMA模型作为基础,当然也没有必要停留在52000个问题上。

斯坦福大学的团队已经在Github上发布了这项研究中使用的52000个问题,以及生成更多问题的代码,还有他们用来微调LLaMA模型的代码。该团队指出,"我们还没有对模型进行微调,使其安全无害",并要求任何建立这种模型的人报告他们发现的安全和道德问题。

那么,有什么可以阻止任何人现在花100美元左右创建他们自己的人工智能,并以他们选择的方式训练它?OpenAI的服务条款确实带来了一些法律问题,它说:"你不能......使用服务的输出来开发与OpenAI竞争的模型"。而Meta说它在现阶段只允许学术研究人员在非商业许可下使用LLaMA,尽管这是一个有争议的问题,因为整个LLaMA模型在公布一周后就在4chan上泄露了。

哦,还有一个小组说它已经设法消除了云计算成本,在Github上发布了更多的代码,可以在树莓派上运行,并在单个高端nVidia RTX 4090显卡上在5小时内完成训练过程。

图片.png

图片.png© 由 cnBeta.COM 提供

这一切意味着什么?现在可以建立无限数量的不受控制的语言模型--由具有机器学习知识、不在乎条款和条件或软件盗版的人建立--只需花钱,而且并不是高不可攀。

这也给致力于开发自己的语言模型的商业人工智能公司泼了一盆冷水;如果所涉及的大部分时间和费用都发生在训练后阶段,而这项工作或多或少可以在回答50或100000个问题的时间内被窃取,那么公司继续砸钱是否有意义?

而对于我们其他人来说,嗯,很难说,但这个软件的强大功能肯定可以为专制政权、网络钓鱼行动、垃圾邮件发送者或任何其他可疑的人所用。

精灵已经从瓶子里出来了,而且似乎已经非常容易复制和重新训练了。


相关文章

AI让大脑变懒变笨了吗?

近日,一项公布于预印本服务器arXiv的研究发现,使用ChatGPT写论文的人,其大脑活跃度低于被禁止使用任何在线工具写论文的人。这项调查是评估人工智能(AI)是否正使人们变得“认知懒惰”的更广泛研究......

ChatGPT发布两周年,OpenAI“官司缠身”

ChatGPT的诞生加速了生成式人工智能领域的融资,但这一趋势的引领者OpenAI却因版权问题和转向营利性公司导致“官司缠身”,两周年生日过得似乎并不顺心。美媒《商业内幕》12月1日报道,据CBIns......

数年心血被轻松实现,科研如何与大模型合作共生

一名化学博士发现,自己需要花费一年做的实验研究,Claude3(Anthropic公司发布的通用大语言模型)仅用两个小时便可给出方案,且比原方案更简洁、成本更低;一名研究量子物理学方向的博士手握一篇还......

OpenAI又地震:ChatGPT负责人离职

OpenAI内部仍动荡不安,ChatGPT的两位重要负责人选择离开。8月6日,AI(人工智能)巨头OpenAI联合创始人约翰·舒尔曼(JohnSchulman)在X(推特)发文表示,将离开OpenAI......

澳高校如何应对人工智能挑战

近年来,教育领域,特别是高等教育领域的人工智能趋势日益明显,并在世界范围内形成一股热潮。这其中,澳大利亚大学的数字化及人工智能教育一直以其卓越的研究能力、学习者满意度和就业成果享誉全球,由此带动了澳大......

半个月内两次宕机,ChatGPT安全性引担忧

美国开放人工智能研究中心(OpenAI)开发的聊天机器人产品ChatGPT继本月4日发生故障后,17日再次出现宕机事故,无法回答用户提问。ChatGPT半个月内接连宕机,引发用户和业内人士对其稳定性与......

OpenAI员工发公开信警告AI风险,认为可能导致“人类灭绝”

多家美国人工智能(AI)领域企业的在职和离职员工当地时间4日发表公开信,对这项新兴技术带来的风险表示担忧。据路透社5日报道,公开信的签署者包括美国AI初创企业OpenAI以及谷歌旗下“深层思维”公司的......

GPT5在路上了?OpenAI透露开始训练下一个前沿模型

中新网5月29日电(中新财经记者吴涛)“OpenAI最近开始训练其下一个前沿模型,我们预计最终的系统将使我们在通往AGI的道路上更上一层楼。”近日,OpenAI对外公布,OpenAI董事会成立了安全与......

ChatGPT如何“思考”

北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人工智能(AI)领域再起硝烟。尽管AI一词已很普及,但其内部运作方式仍像黑箱操作一样,是一个谜。......

ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手

新品发布在即,奥特曼的最新表态或暗示OpenAI意在人工智能语音助手。当地时间5月11日,人工智能(AI)巨头OpenAICEO山姆·奥特曼(SamAltman)在一档播客节目中称,OpenAI将继续......