如何训练个人的ChatGpt4-六虎

如安在自己的核算机上装置相似 ChatGPT 的个人 AI 并在没有互联网的情况下运转它

本文旨在为任何人装置此软件。最初它有一个视频，伴随着操作方法，可是作业改变很快，我的三次尝试仅仅推迟了我发表这篇文章。我今后可能会包括它。我尽力创立一个简略的分步说明，为极端新手装置个人 AI。可能从未去过GitHub而且从未运用过终端的人。假如你是有的人，那么这篇文章很可能不适合你。您可能会发现咱们已经构建的一些本地模型，并将很快发布，以使其更有趣。假如您是装置软件的专家，请将精力会集在协助他人和社区上，而不是“谁不知道”或“我知道，他仅仅在写……”有点评论。用你的力气和技能把咱们都提升得更高。

个人 AI 的“第一台 PC”时刻

这是个人AI的“第一台PC”时刻，随之而来的是约束，就像在车库里出产第一台Apple 1一样。你是先驱。今日，任何人都能够运用私人和个人AI。您能够在自己的核算机上运转相似 ChatGPT 的功用版别，而且在装置后不需求将其连接到互联网。

所有人类常识都是已知和未知的综合。人工智能用作正力多路复用器和您的智力放大器，您的个人人工智能很好地协助您和咱们所有人克服这一差距。有了你的个人人工智能和正确的超级提示，人类将以前所未有的方式蓬勃发展。此时你唯一需求的就是知道这一点的力气，并把它拿在手中去处理它，因为你想为你和你爱的每个人看到这个国际。它不是AI，而是IA（智能放大）。

一个属于个人人工智能的一个例子

咱们今日将介绍的体系（我将写更多）能够在最新且典型的但不是高性能 CPU 上运转，具有 8GB RAM 和仅 4GB 磁盘空间。是的，整个模型，在仅4GB的磁盘空间中包含了大量的人类常识语料库。有约束吗？答案是肯定的。它不是 ChatGPT 4，它不会正确处理某些作业。可是，它是有史以来最强壮的个人人工智能体系之一。它被称为GPT4All。

GPT4All是一个免费的开源类ChatGPT大型言语模型（LLM）项目，由Nomic AI（Nomic.ai）的程序员团队完结。这是许多志愿者的作业，但领导这项作业的是令人惊叹的Andriy Mulyar Twitter：@andriy_mulyar。假如您发现该软件有用，我敦促您经过与他们联络来支撑该项目。GPT4All 根据 LLaMA 7B 模型构建。LLaMA代表大型言语模型元（Facebook）AI。它包括从 7 亿（7B）到 65 亿个参数的一系列模型大小。Meta AI 研讨人员专心于经过增加练习数据量而不是参数数量来扩展模型的性能。他们声称 13 亿个参数模型的性能优于 GPT-175 模型的 3 亿个参数。它运用转换器架构，并经过网络抓取维基百科，GitHub，Stack Exchange，古腾堡项意图书籍，ArXiv上的科学论文提取了1.4万亿个代币。

Nomic AI团队对LLaMA 7B和终究模型的模型进行了微调，并在437，605个后处理帮手式提示上对其进行了练习。他们从另一个名为Alpaca的相似ChatGPT的项目中取得灵感，但运用OpenAI API的GPT-3.5-Turbo收集了大约800，000个提示响应对，以创立437，605个帮手式提示和代代的练习对，包括代码，对话和叙述。可是，800K对大约是羊驼的16倍。该模型最好的部分是它能够在CPU上运转，不需求GPU。像羊驼一样，它也是一个开源，能够协助个人进行进一步的研讨，而无需花费商业解决方案。

具体的模型超参数和练习代码能够在 GitHub 存储库中找到，github.com/nomic-ai/gp… GPT4All 大约需求四天时刻，并产生了 800 美元的 GPU 费用和 500 美元的 OpenAI API 费用。此外，终究的gpt4all-lora模型能够在大约100小时内涵Lambda Labs DGX A8 80x 8GB上进行练习，总成本为100美元。

GPT4All 将其困惑度与最知名的羊驼-lora 模型进行了比较，并表明与 Alpaca 比较，微调的 GPT4All 模型在自辅导评价中表现出较低的困惑度。可是，因为鼓舞用户在本地CPU上运转模型以取得对其功用的定性见解，因而此评价并不详尽。

Nomic AI团队在几天内完结了所有这些作业，而且仅在4GB的磁盘空间中完结。它是免费和开源的。重要的是要知道所有本地化的个人人工智能模型和软件都是非常新的，一般不是为普通人设计的。它是开源的，没有“客户服务和支撑”。装置一般是“转到 Git Hub 并克隆它”。因而，这是前期的先驱者时代，因而您需求耐性等候。报答是你自己的个人AI。我觉得个人人工智能是一场革新，相当于轿车的发明。直到亨利福特（Henry Ford）让轿车触手可及，人类才打破了阻止咱们的边界。这就是我写这篇操作方法文章的精力，我期望它能够协助即使是技术上最具挑战性的人也能取得这个新东西。

但为什么要有个人人工智能呢？会有无穷无尽的原因，但有些是：

数据隐私：许多公司都期望控制数据。这对他们来说很重要，因为他们不期望任何第三方拜访他们的数据。
定制：它答应开发人员运用自己的数据练习大型言语模型，假如他们想运用某些主题，能够对某些主题进行一些过滤
经济实惠：开源 GPT 模型可让您练习复杂的大型言语模型，而无需担心昂贵的硬件。
人工智能民主化：它为进一步的研讨开辟了空间，可用于解决实际国际的问题。
自在：人工智能正迅速成为检查、监管和更糟的方针。这可能是拥有自己的AI的终究时机。意大利已经制止了ChatGPT，所以请注意。
个性化练习：下载基本模型后，您能够练习模型以保留您的个人数据，以便对其进行分析和构建神经元。

还有许多其他原因，几乎没有一个是出于“不良意图”。假如一个坏人想问“坏”的作业，有比本地人工智能更容易的方法。可是，运用下面模型的SECRET版别，您可能会对某些成果感到冒犯。它旨在供给没有过滤器的原始成果。您能够在模型之间切换以衡量其编辑方式。因而，假如您很敏感而且一般很容易被冒犯，这是一个正告，请不要下载SECRET版别。假如你想看看LLM AI是怎么“理解”你和我实际日子的国际，我建议运用SECRET版别，而它仍然可用。

您将拥有自己的AI，您不用对任何人负责，但要答复自己

这个帖子有点像一个试验。当然，你能够去很多当地取得GPR4All。我只为会员发布内容有一些原因。一个原因是职责。出于某些原因，我有点犹豫要不要在这里发布这个。当你将人工智能用于任何意图时，要沉着，要有荣誉和庄严。这既是石蕊测验，也是罗夏测验，测验你是谁，你在日子和成熟中的方位。假如你觉得有必要做“人工智能说了一件坏事”之类的作业，那就去做吧，但要知道你仅仅为了保证人工智能在未来你和你的孩子的某个时候不会是免费的和本地的。这是职责，它完全在你的肩膀上。我以为您能够在私人核算机上做任何您喜爱的作业。我以为在社交媒体上共享任何有意义的、有意义的、有真正意图的东西都是能够的。可是，另一方面，咱们大多数人可能会以为任何让人工智能“风险”的人都是为了一个意图而支撑起来的，这个意图很可能是为了“安全”而发明“监管人工智能”的条件，咱们中的一些人会评判你并记住你。咱们的人工智能也是如此。假如你觉得自己没有能力变得沉着，没有荣誉和庄严，为了你的家族血缘让你来到这里，要么长大，要么继续前进，玩其他东西。欢迎所有其他人探究。不知道还能怎么说，但不得不说。

您将拥有自己的AI。

在任何100 +笔记本电脑的硬盘驱动器中对新的更小的3%本地运转的ChatGPT 5.2015涡轮增压型LLM AI进行终究测验。

我将有预先配置的下载，它比我拥有的大多数类型都要小得多，只有 4GB。

快出来了！pic.twitter.com/KnZkICmGPV

— 布赖恩罗梅尔（@BrianRoemmele） 5 年 2023 月 <> 日

终究，这是为您构建本地AI模型。最低体系相似ChatGPT的体系会变得更好，但这是PC与大型机时代。不要陷入历史的错误一面。支撑独立的个人 AI。它会支撑你。

装置 GPT4All

拉取GPT4All

git clone https://github.com/nomic-ai/gpt4all.git

现在，您需求下载运转软件所需的量化模型文件。为此，请转到以下链接：

迅雷云盘：

pan.xunlei.com/s/VNSv11jQz…

下载完结今后将数据放置gpt4all的chat目录下面

然后翻开控制台，而且进入到这个目录，履行exe文件

gpt4all-lora-quantized-win64.exe

效果图：

而且发问 c#

等候回应，咱们发现它回复了，而且我并没有跟OpenAi相关联，它是完全本地离线的。

关于GPT4All的答复也能够自己练习和探究，本文仅仅体会一下效果，假如想体会请按照文章次序进入，

关于企业能够练习文档帮手，比照搜索引擎，它的答复会更好

来自token的共享

引荐一款ChatGpt桌面端它是跨渠道的支撑android mac win ios web多渠道的客户端

github.com/239573049/C…

技术交流群：737776595

如何训练个人的ChatGpt4

一个属于个人人工智能的一个例子

装置 GPT4All

相关文章

AMS源码分析(二)onActivityResult执行过程

大模型背景下，知识图谱该何去何从？

2022下半年《软考-系统架构设计师》备考经验分享

《小团队web技术搭建》（十一）聊聊堡垒机

作者信息