1.引言
ChatGPT在当下现已风靡一时,作为自然言语处理模型的佼佼者,ChatGPT的优势在于其能够生成流通、连贯的对话,一起还能够了解上下文并依据上下文进行答复。针对不同的应用场景能够进行快速定制,例如,在客服、教育、文娱等领域中,ChatGPT能够作为智能助手为用户供给便捷的服务和文娱体验。
从GPT-3到GPT-4,咱们能够看到在高档推理,输入设置,微调行为和了解更长的上下文信息等方面,ChatGPT在不断的优化训练中现已取得了显著的发展。
可是针对于这种交互式的GPT模型,咱们更希望看到能像电影里的人工智能,具有自我意识,能够进行自我学习和进化。不需求经过频繁的引导和交互,咱们只需求简略提出一个方针,AI就能自主的完结一切的履行规划和逻辑处理,并不断进行自我证明和优化,最终完结咱们提出的方针。
那么今天它来了,它便是ChatGPT的进化版别:AutoGPT。
2.什么是AutoGPT?
AutoGPT 是一个实验性开源应用程序,它运用 OpenAI 的GPT-4言语模型来创立彻底自主和可定制的 AI 署理。它于 2023 年 3 月 30 日由 Toran Bruce Richards 发行。
Toran 是一名游戏开发商,并创立了一家名为 Significant Gravitas 的游戏公司。
在短短的一个多月时间里,AutoGPT的Git项目现已取得了超越12万的star,作为 GPT-4 彻底自主运行的第一批示例之一,AutoGPT 突破了 AI 的或许性界限。
与其他 AI 东西比较,AutoGPT 是绝无仅有的,因为它独立运行,这意味着你不再需求操作模型来满意你的需求。相反,你只需求写下你的方针,然后 AI 会为你完结剩下的作业。因而,AutoGPT 从根本上改变了 AI 与人类之间的交互方法,人类不再需求发挥积极作用,一起仍然坚持与 ChatGPT 等其他 AI 应用程序相同或更好的成果质量。
3.AutoGPT 怎么作业?
AutoGPT 基于自主 AI 机制作业,其中 AI 体系创立不同的 AI 署理来满意特定使命,其中包含:
- 使命创立署理: 当你在 AutoGPT 上输入方针时,第一个与使命创立署理交互的 AI 署理。依据你的方针,它将创立一个使命列表以及实现这些方针的过程,并将其发送给优先级署理。
- 使命优先级署理: 收到使命列表后,优先级 AI 署理会确保顺序正确且符合逻辑,然后再将其发送给履行署理。
- 使命履行署理: 完结优先级排序后,履行署理将一个接一个地完结使命。这触及运用 GPT-4、互联网和其他资源来取得成果。
上述署理之间相互通讯。所以当履行署理完结一切使命,成果不理想时,它能够与使命创立署理通讯,创立新的使命列表。三个署理之间的迭代循环,直到完结一切用户界说的方针。
AI 署理的行为也显现在用户界面上,将它们分为四组:思想、推理、计划、评判。
- 思想(THOUGHTS) :AI 署理同享它对方针的主意。
- 推理(REASONING) :AI 署理推理怎么展开并实现它的主意。
- 计划(PLAN) :AI署理经过剖析,列举了所要完结使命的计划。
- 评判(CRITICISM) :AI进行自我评判,纠正过错并克服任何约束问题。
经过同享此核算流程,AutoGPT 能够进行重复测验证明,并进行针对性的优化处理,能够在没有任何用户干预的情况下克服所遇到的一切问题。
3.AutoGPT和ChatGPT的对比?
尽管底层的 LLM 模型是相同的,可是 AutoGPT 和 ChatGPT 之间还是有不少差异。
3.1 实时洞悉
ChatGPT 运用的最新 GPT-4 模型是在与 GPT-3.5 相同的数据上训练的,该数据仅到 2021 年 9 月,你无法运用 ChatGPT 取得实时数据信息,因为你无法拜访网站和在线途径来获取信息和提取信息。
比较之下,AutoGPT 能够拜访互联网。它不仅能够上网冲浪,还能够验证来历是否合法。此外,AutoGPT 能够拜访任何途径来履行使命。例如,假如你要求 AI 研究销售产品的前景并发送外联电子邮件,它会直接运用你的 Gmail 帐户起草并发送电子邮件。
3.2 内存办理
上下文窗口对于言语模型给出准确答案非常重要。但在像 GPT-4 这样的 LLM 中,窗口有 4000 到 8000 个令牌的约束。因而,假如要求超出约束,模型或许无法正确遵循一切指令,或许或许违背正切并供给不可靠的输出。
比较之下,AutoGPT 拿手短期和长时间内存办理。经过运用数据库,本地Cache和Redis进行内存办理,能够存储许多上下文信息或以前的经历,让AI模型做出更好的决策。
3.3 图画生成
AutoGPT 能够生成图画,因为它能够运用多种图画生成引擎,默许运用DALL-E 。假如你想为你的 AI 署理启用图画生成功用,你需求拜访 DALL-E 的 API。尽管是多形式输入方法,但此功用目前在 ChatGPT-4 中不可用。
3.4 文字转语音
你能够经过在指令行中键入python -m autogpt --speak
在 AutoGPT 上启用文本到语音转化。可是每次与 AutoGPT 交互时都有必要输入指令。你还能够经过将 AutoGPT 连接到多功用 AI 语音软件 Eleven Labs,为语音增加不同的声音。
4.AutoGPT 的局限性
毫无疑问,自主性为AI体系增加了一个新的维度。一起,咱们也不能忽视AutoGPT的局限性和危险。下面列出了你有必要知道的一些要害约束。
4.1 本钱昂扬
尽管功用令人惊叹,但 AutoGPT 的实用性或许会让你失望。因为 AutoGPT 运用贵重的 GPT-4 模型,因而即使是小使命,完结每个使命的本钱也或许很高。这首要是因为 AutoGPT 在特定使命的过程中会屡次运用 GPT-4。
4.2 常常堕入循环
用户在运用 AutoGPT 时面对的最常见问题是它堕入循环。假如这种情况继续超越几分钟,则或许意味着你有必要重新发动该过程。发生这种情况是因为 AutoGPT 依靠 GPT-4 来正确界说和分解使命。因而,假如底层LLM回来成果不足以让 AutoGPT 采纳任何行动就会呈现重复测验的问题。
4.3 数据安全性
因为AutoGPT经过充沛授权,能自主运行并拜访你的体系和互联网,例如运用你的twitter账号,登录github,运用查找引擎等,因而你的数据或许会被走漏。AutoGPT没有安全署理,所以你在运用 AutoGPT 时有必要当心,假如没有给出正确的阐明和安全攻略,你不能让模型继续运行。**
5.怎么装置 AutoGPT?
与其他人工智能东西不同,AutoGPT 没有简略的注册程序来拜访其途径和功用。在开端运用 AutoGPT 之前,你有必要下载各种软件以满意要求。以下是具体的过程要求:
-
第一步:下载必备软件
首要你需求有一个Git账号,一起需求装置Python3.1.0或许更高版别,此外你有必要还能熟练运用常用的shell指令或许有Docker容器进行项目发动和装备。
-
第二步:设置你的 OpenAI API 密钥
假如你还没有,请创立一个 OpenAI 帐户(当然假如你在国内想要创立账号不是一件简略的事情,你能够参阅网上其他文章进行账号申请)。翻开OpenAI帐户后,翻开USER – API keys转到 API 密钥选项卡。你将看到一个用于创立密钥的选项。单击它,然后仿制密钥。
-
第三步:克隆最新版别的AutoGPT
(1)clone项目
翻开指令行东西经过指令git clone https://github.com/Torantulino/Auto-GPT.git
将项目clone到本地
(2)履行装置
经过指令cd Auto-GPT && ls -al
进入目录后,能够看到有许多的文件,其中一个文件是requirements.txt。在此文件中,你将看到运行 AutoGPT 所需的模块。
要装置这些模块,能够运用指令pip install -r requirements.txt
进行下载装置。
(3)修改装备
经过指令vim .env.template
进行open-api-key的装备(修改并替换your-openai-api-key
),装备完结后履行mv .env.template .env
使装备收效
其他相关的装备能够参阅表格按需进行
LLM PROVIDER | 能够装备OPENAI_API_KEY,是否运用AZURE |
---|---|
LLM MODEL SETTINGS | 能够装备openAI供给的token约束,防止过度调用本钱糟蹋 ,默许4000-8000 |
LLM MODELS | LLM 底层言语模型,默许能够选择GPT-4或许gpt-3.5-turbo |
MEMORY | 内存办理,能够装备local,redis,PINECONE,MILVUS等 |
IMAGE GENERATION PROVIDER | 图画生成,能够装备图画大小和图画生成引擎:dalle,HUGGINGFACE,STABLE DIFFUSION WEBUI |
AUDIO TO TEXT PROVIDER | 语音转文字,能够装备HUGGINGFACE |
GIT Provider for repository actions | github装备,经过装备github api key用于拜访和办理github |
WEB BROWSING | 查找引擎办理,能够装备不同的浏览器:firefox,chrome,safari,查找引擎:google等授权open api用于拜访互联网获取信息和办理拜访深度 |
TTS PROVIDER | 文本转语音,能够装备MAC OS,STREAMELEMENTS,ELEVENLABS来进行文本转语音 |
TWITTER API | twitter账号办理,办理装备你的twitter账号,装备token用于拜访对应的api |
AUTO-GPT – GENERAL SETTINGS | AutoGPT的一些默许装备,例如存放目录,开关,user Agent ,AI settings等 |
(4)开端运用
在完结以上装备以后,就现已完结了AutoGPT的根本装备,这时候就能够经过指令python -m autogpt
开启你的AutoGPT之旅 !
从上图能够看出,AutoGPT需求你为AI取一个姓名[Name],一个角色定位[Role],一起你能够为它拟定方针[Goals](最多5个方针,假如你仅有一个方针就直接回车)。
在你拟定完结方针以后,AutoGPT会进行自主考虑并剖析你的方针[THOUGHTS],考虑完结后开端了解并推理怎么去完结这个方针[REASONING],然后开端自主拆解成具体的计划[PLAN],最终会提出评判[CRITICISM]用以保证 AI 署理纠正过错并作出正确的决断。
完结以上的行为规划后,AutoGPT会提示它将要作出的指令和动作[NEXT ACTION], 里边包含具体履行的指令[COMMAND]和参数[ARGUMENTS],用户能够在此时能够对危险指令进行识别,防止呈现数据走漏等预期外的危险,这里能够经过y
或许n
进行授权或许回绝AutoGPT接下来的指令动作。
AutoGPT会经过以上过程,进行屡次循环,因为AutoGPT能够存储上下文和历史经历,所以每一次都会依据反应成果进行更深化的考虑,拟定出更优的计划,最终列举他要履行的计划,重复测验和补充,直到达到你预期的方针。
AutoGPT会经过以上过程,进行屡次循环,因为AutoGPT能够存储上下文和历史经历,所以每一次都会依据反应成果进行更深化的考虑,拟定出更优的计划,最终列举他要履行的计划,重复测验和补充,直到达到你预期的方针。
(5)Docker运用
当然,你也能够运用docker运行 :
// 最简略的方法便是经过docker-compose
docker-compose build auto-gpt
docker-compose run --rm auto-gpt
// 运用docker指令构建
docker build -t auto-gpt .
docker run -it --env-file=.env -v $PWD:/app auto-gpt
你能够传递额定的参数,例如,运行方法--gpt3only
和--continuous
形式:
// docker-compose
docker-compose run --rm auto-gpt --gpt3only --continuous
// docker
docker run -it --env-file=.env -v $PWD:/app --rm auto-gpt --gpt3only --continuous
6.总结
与传统的文本生成技能比较,咱们发现AutoGPT的才能进化令人震惊,它能够经过剖析你的方针,主动拆解成它需求履行的使命,并在履行的过程中依据已有的经历和决策不断优化完善和总结,一起AutoGPT获取信息的手段也非常丰富,它能经过查找引擎查找,github,网页东西等途径下载和提炼所需求的信息,经过本地缓存,语音转化,图画生成等插件才能,最终完结你所建立的方针。这种自我意识,自我迭代和更新的形状现已非常接近于电影《漂泊地球》里的moss这种人工智能!
最终问题来了,这篇文章是AutoGPT主动生成的吗?
文:Leo
线下活动推荐:
时间: 2023年6月10日(周六) 14:00-18:00主题: 得物技能沙龙总第18期-无线技能第4期地点: 杭州西湖区学院路77号得物杭州研发中心12楼训练教室(地铁10号线&19号线文三路站G口出)
活动亮点: 本次无线沙龙聚集于最新的技能趋势和实践,将在杭州/线上为你带来四个令人等待的讲演论题,包含:《抖音创作东西-iOS功耗监控与优化》、《得物隐私合规途径建造实践》、《网易云音乐-客户端大流量活动的日常化保障计划实践》、《得物Android编译优化》。相信这些论题将对你的作业和学习有所协助,咱们等待着与你一起探讨这些令人兴奋的技能内容!
点击报名: 无线技能沙龙
本文属得物技能原创,来历于:得物技能官网
未经得物技能许可严禁转载,不然依法追究法律责任!