1.引言

ChatGPT在当下现已风靡一时，作为自然言语处理模型的佼佼者，ChatGPT的优势在于其能够生成流通、连贯的对话，一起还能够了解上下文并依据上下文进行答复。针对不同的应用场景能够进行快速定制，例如，在客服、教育、文娱等领域中，ChatGPT能够作为智能助手为用户供给便捷的服务和文娱体验。

从GPT-3到GPT-4，咱们能够看到在高档推理，输入设置，微调行为和了解更长的上下文信息等方面，ChatGPT在不断的优化训练中现已取得了显著的发展。

可是针对于这种交互式的GPT模型，咱们更希望看到能像电影里的人工智能，具有自我意识，能够进行自我学习和进化。不需求经过频繁的引导和交互，咱们只需求简略提出一个方针，AI就能自主的完结一切的履行规划和逻辑处理，并不断进行自我证明和优化，最终完结咱们提出的方针。

那么今天它来了，它便是ChatGPT的进化版别：AutoGPT。

2.什么是AutoGPT？

AutoGPT 是一个实验性开源应用程序，它运用 OpenAI 的GPT-4言语模型来创立彻底自主和可定制的 AI 署理。它于 2023 年 3 月 30 日由 Toran Bruce Richards 发行。

Toran 是一名游戏开发商，并创立了一家名为 Significant Gravitas 的游戏公司。

在短短的一个多月时间里，AutoGPT的Git项目现已取得了超越12万的star，作为 GPT-4 彻底自主运行的第一批示例之一，AutoGPT 突破了 AI 的或许性界限。

与其他 AI 东西比较，AutoGPT 是绝无仅有的，因为它独立运行，这意味着你不再需求操作模型来满意你的需求。相反，你只需求写下你的方针，然后 AI 会为你完结剩下的作业。因而，AutoGPT 从根本上改变了 AI 与人类之间的交互方法，人类不再需求发挥积极作用，一起仍然坚持与 ChatGPT 等其他 AI 应用程序相同或更好的成果质量。

3.AutoGPT 怎么作业？

AutoGPT 基于自主 AI 机制作业，其中 AI 体系创立不同的 AI 署理来满意特定使命，其中包含：

使命创立署理： 当你在 AutoGPT 上输入方针时，第一个与使命创立署理交互的 AI 署理。依据你的方针，它将创立一个使命列表以及实现这些方针的过程，并将其发送给优先级署理。
使命优先级署理： 收到使命列表后，优先级 AI 署理会确保顺序正确且符合逻辑，然后再将其发送给履行署理。
使命履行署理： 完结优先级排序后，履行署理将一个接一个地完结使命。这触及运用 GPT-4、互联网和其他资源来取得成果。

上述署理之间相互通讯。所以当履行署理完结一切使命，成果不理想时，它能够与使命创立署理通讯，创立新的使命列表。三个署理之间的迭代循环，直到完结一切用户界说的方针。

AI 署理的行为也显现在用户界面上，将它们分为四组：思想、推理、计划、评判。

思想（THOUGHTS） ：AI 署理同享它对方针的主意。
推理（REASONING） ：AI 署理推理怎么展开并实现它的主意。
计划（PLAN） ：AI署理经过剖析，列举了所要完结使命的计划。
评判（CRITICISM） ：AI进行自我评判，纠正过错并克服任何约束问题。

经过同享此核算流程，AutoGPT 能够进行重复测验证明，并进行针对性的优化处理，能够在没有任何用户干预的情况下克服所遇到的一切问题。

3.AutoGPT和ChatGPT的对比？

尽管底层的 LLM 模型是相同的，可是 AutoGPT 和 ChatGPT 之间还是有不少差异。

3.1 实时洞悉

ChatGPT 运用的最新 GPT-4 模型是在与 GPT-3.5 相同的数据上训练的，该数据仅到 2021 年 9 月，你无法运用 ChatGPT 取得实时数据信息，因为你无法拜访网站和在线途径来获取信息和提取信息。

比较之下，AutoGPT 能够拜访互联网。它不仅能够上网冲浪，还能够验证来历是否合法。此外，AutoGPT 能够拜访任何途径来履行使命。例如，假如你要求 AI 研究销售产品的前景并发送外联电子邮件，它会直接运用你的 Gmail 帐户起草并发送电子邮件。

3.2 内存办理

上下文窗口对于言语模型给出准确答案非常重要。但在像 GPT-4 这样的 LLM 中，窗口有 4000 到 8000 个令牌的约束。因而，假如要求超出约束，模型或许无法正确遵循一切指令，或许或许违背正切并供给不可靠的输出。

比较之下，AutoGPT 拿手短期和长时间内存办理。经过运用数据库，本地Cache和Redis进行内存办理，能够存储许多上下文信息或以前的经历，让AI模型做出更好的决策。

3.3 图画生成

AutoGPT 能够生成图画，因为它能够运用多种图画生成引擎，默许运用DALL-E 。假如你想为你的 AI 署理启用图画生成功用，你需求拜访 DALL-E 的 API。尽管是多形式输入方法，但此功用目前在 ChatGPT-4 中不可用。

3.4 文字转语音

你能够经过在指令行中键入python -m autogpt --speak在 AutoGPT 上启用文本到语音转化。可是每次与 AutoGPT 交互时都有必要输入指令。你还能够经过将 AutoGPT 连接到多功用 AI 语音软件 Eleven Labs，为语音增加不同的声音。

4.AutoGPT 的局限性

毫无疑问，自主性为AI体系增加了一个新的维度。一起，咱们也不能忽视AutoGPT的局限性和危险。下面列出了你有必要知道的一些要害约束。

4.1 本钱昂扬

尽管功用令人惊叹，但 AutoGPT 的实用性或许会让你失望。因为 AutoGPT 运用贵重的 GPT-4 模型，因而即使是小使命，完结每个使命的本钱也或许很高。这首要是因为 AutoGPT 在特定使命的过程中会屡次运用 GPT-4。

4.2 常常堕入循环

用户在运用 AutoGPT 时面对的最常见问题是它堕入循环。假如这种情况继续超越几分钟，则或许意味着你有必要重新发动该过程。发生这种情况是因为 AutoGPT 依靠 GPT-4 来正确界说和分解使命。因而，假如底层LLM回来成果不足以让 AutoGPT 采纳任何行动就会呈现重复测验的问题。

4.3 数据安全性

因为AutoGPT经过充沛授权，能自主运行并拜访你的体系和互联网，例如运用你的twitter账号，登录github，运用查找引擎等，因而你的数据或许会被走漏。AutoGPT没有安全署理，所以你在运用 AutoGPT 时有必要当心，假如没有给出正确的阐明和安全攻略，你不能让模型继续运行。**

5.怎么装置 AutoGPT？

与其他人工智能东西不同，AutoGPT 没有简略的注册程序来拜访其途径和功用。在开端运用 AutoGPT 之前，你有必要下载各种软件以满意要求。以下是具体的过程要求：

第一步：下载必备软件

首要你需求有一个Git账号，一起需求装置Python3.1.0或许更高版别，此外你有必要还能熟练运用常用的shell指令或许有Docker容器进行项目发动和装备。

第二步：设置你的 OpenAI API 密钥

假如你还没有，请创立一个 OpenAI 帐户（当然假如你在国内想要创立账号不是一件简略的事情，你能够参阅网上其他文章进行账号申请）。翻开OpenAI帐户后，翻开USER – API keys转到 API 密钥选项卡。你将看到一个用于创立密钥的选项。单击它，然后仿制密钥。

第三步：克隆最新版别的AutoGPT

（1）clone项目

翻开指令行东西经过指令git clone https://github.com/Torantulino/Auto-GPT.git将项目clone到本地

（2）履行装置

经过指令cd Auto-GPT && ls -al进入目录后，能够看到有许多的文件，其中一个文件是requirements.txt。在此文件中，你将看到运行 AutoGPT 所需的模块。

要装置这些模块，能够运用指令pip install -r requirements.txt进行下载装置。

（3）修改装备

经过指令vim .env.template进行open-api-key的装备(修改并替换your-openai-api-key)，装备完结后履行mv .env.template .env使装备收效

其他相关的装备能够参阅表格按需进行

LLM PROVIDER	能够装备OPENAI_API_KEY，是否运用AZURE
LLM MODEL SETTINGS	能够装备openAI供给的token约束，防止过度调用本钱糟蹋，默许4000-8000
LLM MODELS	LLM 底层言语模型，默许能够选择GPT-4或许gpt-3.5-turbo
MEMORY	内存办理，能够装备local，redis，PINECONE，MILVUS等
IMAGE GENERATION PROVIDER	图画生成，能够装备图画大小和图画生成引擎：dalle，HUGGINGFACE，STABLE DIFFUSION WEBUI
AUDIO TO TEXT PROVIDER	语音转文字，能够装备HUGGINGFACE
GIT Provider for repository actions	github装备，经过装备github api key用于拜访和办理github
WEB BROWSING	查找引擎办理，能够装备不同的浏览器：firefox，chrome，safari，查找引擎：google等授权open api用于拜访互联网获取信息和办理拜访深度
TTS PROVIDER	文本转语音，能够装备MAC OS，STREAMELEMENTS，ELEVENLABS来进行文本转语音
TWITTER API	twitter账号办理，办理装备你的twitter账号，装备token用于拜访对应的api
AUTO-GPT – GENERAL SETTINGS	AutoGPT的一些默许装备，例如存放目录，开关，user Agent ，AI settings等

（4）开端运用

在完结以上装备以后，就现已完结了AutoGPT的根本装备，这时候就能够经过指令python -m autogpt开启你的AutoGPT之旅！

从上图能够看出，AutoGPT需求你为AI取一个姓名[Name]，一个角色定位[Role]，一起你能够为它拟定方针[Goals]（最多5个方针，假如你仅有一个方针就直接回车）。

在你拟定完结方针以后，AutoGPT会进行自主考虑并剖析你的方针[THOUGHTS]，考虑完结后开端了解并推理怎么去完结这个方针[REASONING]，然后开端自主拆解成具体的计划[PLAN]，最终会提出评判[CRITICISM]用以保证 AI 署理纠正过错并作出正确的决断。

完结以上的行为规划后，AutoGPT会提示它将要作出的指令和动作[NEXT ACTION]，里边包含具体履行的指令[COMMAND]和参数[ARGUMENTS]，用户能够在此时能够对危险指令进行识别，防止呈现数据走漏等预期外的危险，这里能够经过y或许n进行授权或许回绝AutoGPT接下来的指令动作。

AutoGPT会经过以上过程，进行屡次循环，因为AutoGPT能够存储上下文和历史经历，所以每一次都会依据反应成果进行更深化的考虑，拟定出更优的计划，最终列举他要履行的计划，重复测验和补充，直到达到你预期的方针。

（5）Docker运用

当然，你也能够运用docker运行：

// 最简略的方法便是经过docker-compose
docker-compose build auto-gpt
docker-compose run --rm auto-gpt
// 运用docker指令构建
docker build -t auto-gpt .
docker run -it --env-file=.env -v $PWD:/app auto-gpt

你能够传递额定的参数，例如，运行方法--gpt3only和--continuous形式：

// docker-compose
docker-compose run --rm auto-gpt --gpt3only --continuous
// docker 
docker run -it --env-file=.env -v $PWD:/app --rm auto-gpt --gpt3only --continuous

6.总结

与传统的文本生成技能比较，咱们发现AutoGPT的才能进化令人震惊，它能够经过剖析你的方针，主动拆解成它需求履行的使命，并在履行的过程中依据已有的经历和决策不断优化完善和总结，一起AutoGPT获取信息的手段也非常丰富，它能经过查找引擎查找，github，网页东西等途径下载和提炼所需求的信息，经过本地缓存，语音转化，图画生成等插件才能，最终完结你所建立的方针。这种自我意识，自我迭代和更新的形状现已非常接近于电影《漂泊地球》里的moss这种人工智能！

最终问题来了，这篇文章是AutoGPT主动生成的吗？

文：Leo

线下活动推荐：

时间： 2023年6月10日（周六） 14:00-18:00主题：得物技能沙龙总第18期-无线技能第4期地点： 杭州西湖区学院路77号得物杭州研发中心12楼训练教室（地铁10号线&19号线文三路站G口出）

活动亮点： 本次无线沙龙聚集于最新的技能趋势和实践，将在杭州/线上为你带来四个令人等待的讲演论题，包含：《抖音创作东西-iOS功耗监控与优化》、《得物隐私合规途径建造实践》、《网易云音乐-客户端大流量活动的日常化保障计划实践》、《得物Android编译优化》。相信这些论题将对你的作业和学习有所协助，咱们等待着与你一起探讨这些令人兴奋的技能内容！

点击报名： 无线技能沙龙

本文属得物技能原创，来历于：得物技能官网

未经得物技能许可严禁转载，不然依法追究法律责任！

拥有自我意识的AI：AutoGPT ｜得物技术