新智元报道
编辑:编辑部
【新智元导读】Auto-GPT究竟是一个开创性的项目,仍是一个被过度炒作的AI试验?这篇文章为咱们揭开了喧嚣背后的本相,并揭示了Auto-GPT不适合实践应用的约束性。
这两天,Auto-GPT——一款让最强言语模型GPT-4能够自主完结使命的模型,让整个AI圈疯了。
此前爆火的ChatGPT,唯一不太好用的当地,便是需求人类来prompt。
而Auto-GPT的一大打破是,能够让AI自我提示,便是说,这个AI彻底不需求咱们人类了。
短短七天时间,它就在GitHub上获得了惊人star数(已经打破5万),并吸引了很多开源社区的重视。
项目地址:github.com/Torantulino…
Auto-GPT到底有多火,看这张网友做的对比图就知道了——只是几天的时间,它就追平了某个红极一时项目差不多积攒了11年的star。
不过,在为Auto-GPT狂欢的一起,咱们也有必要退一步审视其潜在的不足之处,探讨这个「AI神童」所面对的约束和应战。
近来,Jina AI CEO Han Xiao发表了一篇长文《揭秘Auto-GPT :出产圈套的炒作和硬道理》,与咱们深入探讨了Auto-GPT究竟是一个开创性的项目,仍是另一个被过度炒作的人工智能试验。
Auto-GPT是怎么作业的?
不得不说,Auto-GPT在AI范畴掀起了巨大的波澜,它就像是赋予了GPT-4回忆和实体相同,让它能够独立应对使命,乃至从经验中学习,不断进步自己的功用。
为了便于Auto-GPT是怎么作业的,让咱们能够用一些简略的比方来分化它。
首要,幻想Auto-GPT是一个足智多谋的机器人。
咱们每分配一个使命,Auto-GPT都会给出一个相应的处理方案。比如,需求阅读互联网或运用新数据,它便会调整其战略,直到使命完结。这就像具有一个能处理各种使命的私家帮手,如市场分析、客户服务、市场营销、财务等。
,时长01:46
具体来说,想让Auto-GPT运行起来,就需求依托以下4个组件:
- 架构:
Auto-GPT是运用强壮的GPT-4和GPT-3.5言语模型构建的,它们充当机器人的大脑,帮助它思考和推理。
- 自主迭代:
这就像机器人从过错中学习的才能。Auto-GPT 能够回忆它的作业,在曾经的尽力的基础上再接再厉,并运用它的历史来产生更准确的成果。
- 内存办理:
与矢量数据库(一种内存存储处理方案)集成,使Auto-GPT能够保留上下文并做出更好的决议方案。这就像给机器人装备了长时回忆,能够记住曩昔的经历。
- 多功用性:
Auto-GPT的文件操作、网页阅读和数据检索等功用使其用处广泛。这就像赋予机器人多种技能来处理更广泛的使命。
但是,这些诱人的远景或许还尚未转化为Auto-GPT真实能够完结的才能。
天价的本钱
想要在实践的出产环境中运用Auto-GPT,首要面对的妨碍便是其高昂的本钱。
由于使命需求经过一系列的思想迭代来完结,为了供更好的推理和提示,模型每个step一般都会用尽全部token。
但是,GPT-4的token并不便宜。
根据OpenAI的说法,具有8K上下文窗口的GPT-4模型,关于提示部分,每1000个token收费0.03美元;而关于成果部分,每1000个token收费0.06美元。
而1000个token大概能够换算成750个英文单词。
让咱们分化思想链中每个step的本钱,假设每个动作都用尽了8000个token的上下文窗口,其间80%是提示(6,400个token),20%是成果(1,600个token)。
提示本钱:6,400个token x 0.03美元/1,000个token = 0.192美元
成果本钱:1,600 个代币 x 0.06 美元/1,000个token = 0.096美元
因而,每个step的本钱便是:0.192美元 + 0.096美元 = 0.288美元
平均而言,Auto-GPT完结一项小使命需求50个step。
因而,完结单个使命的本钱便是:50个step x 0.288美元/step = 14.4美元
VUEGPT THOUGHTS: Let's start by checking if there are any updates to VueJS. If there are, we can update to the latest version and proceed. Otherwise, we can move on to creating the TODO list website application.
REASONING: Starting with the most updated and stable version of the framework will ensure our project has the latest features, bug fixes and is properly supported. Creating the TODO list website application is our primary goal, so we can move on to that if there are no updates.
PLAN:
- Check for VueJS updates
- Update to latest version if there are updates
- If no updates, move on to creating the TODO list website application
CRITICISM: None
NEXT ACTION: COMMAND = google ARGUMENTS = {'input': 'VueJS latest version update'}
Enter 'y' to authorise command, 'y -N' to run N continuous commands, 'n' to exit program, or enter feedback for VueGPT...
以VueGPT为例:这是一个Auto-GPT创建的AI,旨在运用Vue JS创建网站应用程序,咱们来看看它在思想链中的一个step
并且这仍是一次就能出成果的状况,假如需求从头生成,本钱会更高。
从这个角度来看,Auto-GPT现在对大部分用户和安排来说,都是不实践的。
开发与出产
乍一看,花14.4美元来完结一项杂乱的使命,如同并无不妥。
举个比如,咱们首要让Auto-GPT制作一份圣诞节食谱。然后,再找它要一份感恩节食谱的话,猜猜会产生什么?
没错,Auto-GPT会按照相同的思想链从头再做一遍,也便是说,咱们需求再花14.4美元才行。
但实践上,这两个使命在「参数」的差异应该只要一个:节日。
已然咱们已经花了14.4美元开发了一种创建食谱的办法,那么再用化相同的钱来调整参数,明显是不符合逻辑的。
幻想一下,在玩《我的国际》(Minecraft),每次都要从头开端制作全部。明显,这会让游戏变得非常无趣
而这便暴露了Auto-GPT的一个根本问题:它无法差异开发和出产。
当Auto-GPT完结方针时,开发阶段就完结了。不幸的是,咱们并没有办法将这一系列操作「序列化」为一个可重用的函数,然后投入出产。
因而,用户每次想要处理问题时都必须从开发的起点开端,不仅费时吃力,并且还费钱。
这种低下功率,引发了关于Auto-GPT在实践国际出产环境中实用性的质疑,也突显了Auto-GPT在为大型问题处理供给可持续、经济有用的处理方案方面的约束性。
循环的泥潭
不过,假如14.4美元真的能处理问题,那么它依然是值得的。
但问题在于,Auto-GPT在实践运用时,经常会陷入到死循环里……
那么,为什么Auto-GPT会陷入这些循环?
要了解这一点,咱们能够把Auto-GPT看作是依靠GPT来运用一种非常简略的编程言语来处理使命。
处理使命的成功取决于两个要素:编程言语中可用的函数规模和GPT的分治法才能(divide and conquer ),即GPT能够多好地将使命分化成预定义的编程言语。惋惜的是,GPT在这两点上都是不足的。
Auto-GPT供给的有限功用能够在其源代码中观察到。例如,它供给了用于查找网络、办理内存、与文件交互、履行代码和生成图画的功用。但是,这种受限的功用集缩小了Auto-GPT能够有用履行的使命规模。
此外,GPT的分化和推理才能依然受到约束。虽然GPT-4相较于GPT-3.5有了明显的改善,但其推理才能远非完美,进一步约束了Auto-GPT的处理问题的才能。
这种状况类似于尝试运用Python构建像《星际争霸》这样杂乱的游戏。虽然Python是一种强壮的言语,但将《星际争霸》分化为Python函数极具应战性。
本质上,有限功用集和GPT-4受限的推理才能的结合,终究造成了这个循环的泥潭,使Auto-GPT在许多状况下无法完结预期的成果。
人类与GPT的差异
分治法是Auto-GPT的关键。虽然GPT-3.5/4在前任基础上有了明显的前进,但在运用分治法时,其推理才能依然无法到达人类水平。
- 问题分化不充沛:
分治法的有用性在很大程度上取决于将杂乱问题分化为较小、易于办理的子问题的才能。人类推理一般能够找到多种分化问题的办法,而GPT-3.5/4或许没有同样程度的适应性或创造力。
- 辨认适宜根本事例的难度:
人类能够直观地挑选适当的根本事例以得到有用的处理方案。相比之下,GPT-3.5/4或许难以确定给定问题的最有用根本事例,这会明显影响分治进程的全体功率和准确性。
- 问题布景了解不充沛:
虽然人类能够运用其范畴常识和布景了解来更好地应对杂乱问题,但GPT-3.5/4受其预先训练的常识所限,或许缺少用分治法有用处理某些问题所需的布景信息。
- 处理堆叠子问题:
人类一般能够辨认出处理堆叠子问题时,并有战略地重用从前核算过的处理方案。而GPT-3.5/4或许没有同样程度的认识,或许会多次冗余地处理相同的子问题,然后导致处理方案的功率降低。
Vector DB:过度的处理方案
Auto-GPT依靠向量数据库进行更快的k-最近邻(kNN)查找。这些数据库检索从前的思想链,并将它们融入到当前查询上下文中,以便为GPT供给一种回忆作用。
但是,考虑到Auto-GPT的约束和约束性,这种办法被批评为过度且不必要地耗费资源。其间,反对运用向量数据库的主要观点源于与Auto-GPT思想链相关的本钱约束。
一个50步的思想链将花费14.4美元,而一个1000步的链将花费更多。因而,回忆大小或思想链的长度很少超过四位数。在这种状况下,对最近邻点进行穷举查找(即256维向量与10,000 x 256矩阵之间的点积)被证明是足够高效的,用时不到一秒钟。
相比之下,每个GPT-4调用大约需求10秒钟来处理,所以实践上约束体系处理速度的是GPT,而非数据库。
虽然在特定场景下,向量数据库或许在某些方面具有优势,但在Auto-GPT体系中完结向量数据库以加快kNN「长时回忆」查找好像是一种不必要的奢侈和过度的处理方案。
智能体机制的诞生
Auto-GPT引进了一个非常风趣的概念,答应生成智能体来托付使命。
虽然,这种机制还处于初级阶段,其潜力尚未被充沛挖掘。不过,有多种办法能够增强和扩展当前的智能体体系,为更高效、更具动态性的互动供给新的或许性。
运用异步智能体能够明显进步功率
一个潜在的改善是引进异步智能体。经过结合异步等候形式,智能体能够并发操作而不会阻塞彼此,然后明显进步体系的全体功率和响应速度。这个概念受到了现代编程范式的启示,这些范式已经采用了异步办法来一起办理多个使命。
另一个有远景的方向是完结智能体之间的相互通讯。经过答应智能体进行通讯和协作,它们能够更有用地一起处理杂乱问题。这种办法类似于编程中的IPC概念,其间多个线程/进程能够共享信息和资源以完结一起方针。
生成式智能体是未来的方向
随着GPT驱动的智能体不断开展,这种立异办法的未来好像十分光明。
新的研讨,如「Generative Agents: Interactive Simulacra of Human Behavior」,强调了根据智能体的体系在模拟可信的人类行为方面的潜力。
论文中提出的生成式智能体,能够以杂乱且引人入胜的方式互动,构成观点,建议对话,乃至自主方案和参与活动。这项作业进一步支持了智能体机制在AI开展中具有远景的观点。
经过拥抱面向异步编程的范式转变并促进智能体间通讯,Auto-GPT能够为更高效和动态的问题处理才能拓荒新或许。
将《生成式智能体》论文中引进的架构和交互形式融入其间,能够完结大型言语模型与核算、交互式智能体的融合。这种组合有或许彻底改变在AI结构内分配和履行使命的方式,并完结更为逼真的人类行为模拟。
智能体体系的开发和探索可极大地促进AI应用的开展,为杂乱问题供给更强壮且动态的处理方案。
总结一下
总归,围绕Auto-GPT的热议引发了关于AI研讨现状以及公众了解在推进新兴技能炒作中的作用的重要问题。
正如上面所展示的,Auto-GPT在推理才能方面的约束性、向量数据库的过度运用以及署理机制的前期开展阶段,揭示了它距离成为实践处理方案还有很长的路要走。
围绕Auto-GPT的炒作,提醒咱们肤浅的了解或许让期望过高,终究导致对AI真实才能的歪曲认识。
话虽如此,Auto-GPT确实为AI的未来指明了一个充满希望的方向:生成式智能体体系。
最终,Han Xiao总结道:「让咱们从Auto-GPT的炒作中吸取教训,培养关于AI研讨的更为细致和知情的对话。」
这样,咱们就能够运用生成式署理体系的变革力量,继续推进AI才能的边界,塑造一个技能真实造福人类的未来。
参考资料:
https://jina.ai/news/auto-gpt-unmasked-hype-hard-truths-production-pitfalls/