你好,我是徐文浩,一个创办过一家AI谈天机器人公司的工程师。

有人说,编译原理、操作体系和图形学是程序员的三大浪漫。不过在整个计算机科学范畴,还有一个超越这三者之外的存在,那就是人工智能。人工智能的诞生其实十分早,公认的来历是1956年的达特茅斯会议。从那个时分开端,**“机器可以思维吗?”**就是人工智能研究者想要答复的一个永久的主题。

在2016年,我离开了飞速开展的拼多多,在年末创办了一家人工智能谈天机器人的公司BotHub。那个时分,Transformer这个当时最重要的根底模型还没有被提出来。在之后的研制进程里边,咱们测验过各种机器学习模型、开源的软件包以及各种云平台供给的处理方案,也经过数据标示、模型的练习,为不少中国出海的企业供给了面向一般消费者的智能谈天机器人。

可是,在这个进程中,咱们一直没有脱节**“有多少人工就有多少智能”**这样一个诅咒。一切的“智能”都来自于许多的人工数据标示,甚至许多硬编码的事务规则。而即便这样,在许多特殊情况下,“人工智能”仍是表现得像一个“人工智障”。也因为如此,整个智能谈天机器人的服务也显得很不经济。所以在2019年,咱们也断了持续研制人工智能的念想,之后的几年里转而专心于面向海外电商范畴的产品研制。

上一年12月初,在ChatGPT刚刚发布没几天,出于作业习气的好奇心,我第一时刻就去测验体会了一下。说实话,刚开端我并没有对这个新的AI谈天机器人抱有太高的期待。毕竟,在曩昔十多年,我的经历告诉我,“有多少人工就有多少智能”。即使是Google、Facebook之前推出的谈天机器人,用不了多久也会被大家玩儿坏,体现出自己“人工智障”的本质。

然而,在简略和ChatGPT聊了几句车轱辘话之后,我测验让它给我写一些简略的Bash脚本和SQL代码,而这一次,我被彻底震住了。它不只精确地舆解了我用自然言语描述的需求,还彻底正确地写出了一个需求杂乱窗口函数的SQL代码。

GPT来了,跑步迎接AI爆发的时代

[reference_begin]注:关于杂乱的需求窗口函数的SQL,ChatGPT写得比我快多了。这个例子我共享在了sharegpt上,链接在这儿。[reference_end]

在这之后的几周里,我沉迷于运用ChatGPT完成各式各样的任务,并且开端测验用OpenAI供给的各种API。一同,我也回头开端研读了曩昔几年AI大模型的论文和开展。事实上,2023年的整个春节里,我都没有停下来歇息过,而是一直对着OpenAI发布的Cookbook做各式各样的测验。

在这个进程中,我有一个强烈的感觉,那就是**“强人工智能”现已来了**。这一次人工智能范畴的开展,彻底不同于80年代的学习理论,也远远超越了2012年的深度神经网络的意义,它会变成一场席卷全世界的风暴。AI运用不只仅是算法工程师和机器学习研究人员的专利了,而是变成了每个工程师都可以快速学习并参加开发的范畴。

于是,在23年的元旦之前,我自动找到了极客时刻,提出了要写这样一门课程。期望可以把新一代的AI运用开发的办法和时机介绍给你。在那个时分,我还没有幻想到仅仅在一个多月之后,ChatGPT和OpenAI就敏捷席卷了国内整个科技职业。我自己对整个范畴的爆发,仍是估量得太保守了。

不过,这个快速的爆发让我进一步信任,这门课程对一切软件开发职业的从业者都是很有价值的。无论是产品司理仍是工程师,甚至于职业之外的事务人员,都值得去学一学看一看。了解新一代AI运用的才能是怎样的,怎样经过几行简略的代码就能把它运用在咱们日常作业和日子中。我以为,人人都应该拥抱新的AI浪潮,学习开发新一代的AI运用。

为什么人人都应该学习怎么开发新一代AI运用?

AI算法工程师原先是一个专门的作业。原来咱们的技能团队里,都会分工成产品司理、UI/UE设计师、前端开发、后端开发、大数据团队和AI算法这样一系列的工种。大部分人关于AI也仅仅有个概念性的了解,其实相对缺乏深入的认识。我为什么说,人人都应该拥抱新的AI浪潮,要去了解怎样开发新的AI运用呢?主要有3个原因。

**第一个原因,是这一轮的AI浪潮里,开发新的AI运用的门槛大大降低了。**曩昔,AI运用开发是一个门槛比较高的范畴。你需求有不错的数学根底,了解微积分、线性代数和概率论;然后把握许多的机器学习和深度学习的知识,了解各种根底模型,比方逻辑回归、SVM、CNN、LSTM等等的原理和完成;接着,你还要学会运用各种机器学习的编程框架,比方TensorFlow或许PyTorch,买上一块价格不菲的GPU测验练习模型;最终,你还需求了解在实践运用里锻炼机器学习的各种实战技巧和模型,比方各式各样的特征工程办法、Dropout等正则化办法、超参数调优等等。关于没有相关经历的人来说,不花上个一两年时刻,你或许很难说得上能用AI算法做出一些有价值的产品出来。

可是这一轮的AI浪潮彻底不用。伴跟着GPT-3、Stable Diffusion这样预练习好的大型根底模型的呈现,以及这些模型的才能经过敞开API的办法供给出来,即使没有任何机器学习的理论知识,你只需求一两天时刻,就能做出一个能处理实践问题的AI运用。

比方,最近你在GitHub上就能看到许多工程师,花上1-2天时刻就做出来的图书翻译、人工智能语音对话的运用。任何一个稍有开发经历的工程师,都可以在几周甚至几天之内,学会运用这些根底模型以及相应的敞开API开发出有运用价值的运用。

from langchain.llms import OpenAIChat
from langchain.text_splitter import SpacyTextSplitter
from llama_index import GPTListIndex, LLMPredictor, SimpleDirectoryReader
documents = SimpleDirectoryReader('./data/mr_fujino').load_data()
llm_predictor = LLMPredictor(llm=OpenAIChat(temperature=0, model_name="gpt-3.5-turbo", max_tokens=1024))
list_index = GPTListIndex(documents, llm_predictor=llm_predictor, 
                          text_splitter=SpacyTextSplitter(pipeline="zh_core_web_sm", chunk_size = 2048))
response = list_index.query("下面鲁迅先生以第一人称‘我’写的内容,请你用中文总结一下:", response_mode="tree_summarize")
print(response)

[reference_begin]注:在第11讲里,我会教你怎么经过简略的10行代码,完成对恣意文本的小结。[reference_end]

**第二个原因,是这一轮的AI浪潮里,对应技能可以运用的范围十分广泛,可以说是包罗万象。**AI本身是计算机刚刚创造出来就有的学科,在前史的进程中也有过许多次大的进步和开展。比方80年代学习理论(Learning Theory)的开展,就使得SVM在实践中被许多运用。2000年之后跟着互联网广告的高速开展,海量参数的分布式机器学习就被广泛运用在查找、引荐和广告的事务中。2012年跟着AlexNet的发布,深度学习和卷积神经网络(CNN)就带来了计算机视觉的爆发。可是,这些前史的开展,往往仅仅某一个细分范畴上的进步。并且这个进程里,关于每一个具体问题咱们都要独自搜集数据、练习独自的机器学习模型来处理里边某一个小问题。

从2020年的GPT-3开端,具有海量参数的大模型登上了前史舞台,直接运用GPT-3这样的预练习好的大言语模型,无需任何微调,就能处理情感剖析、命名实体辨认、机器翻译等一系列的自然言语处理问题。而关于许多AI没见过的问题,也只需经过自然言语给到AI几个例子,经过“小样本学习”(Few-Shot Learning),AI就能给出正确的答复。

GPT来了,跑步迎接AI爆发的时代

[reference_begin]注:零样本以及小样本学习的才能,使得一个大模型可以一次性处理不同类型的许多问题。[reference_end]

在计算机视觉上,像2021年OpenAI宣布的CLIP这样的模型也有相似的效果。咱们关于图片的分类不再局限于预先的人工数据标示的类别,而是可以扩展到任何类别上去。在自然言语、语音、视觉,甚至这些范畴相互融合的多模态范畴里,AI一同在加快开展、在进步。

GPT来了,跑步迎接AI爆发的时代

[reference_begin]注:经过4亿个(图片,文本)对的练习,关于图片的分类可以恣意扩展,而不需求预先标示。[reference_end]

这一轮的AI浪潮开端让咱们看见了“通用人工智能”(AGI)的雏形,AI运用的掩盖范畴被大大扩展了,几乎任何一个问题都有时机经过AI来处理优化。今天你所在的职业和范畴,都有时机经过简略的AI运用开发,进步功率和产出。

**第三个原因,是这个浪潮带来的改动会对咱们每一个人的作业带来巨大的冲击。**在曩昔短短的两三个月里,在个人日子里,我现已习气于让AI帮我写代码,翻译英文资料,修改我写过的文章,为文章配图。在作业上,也现已让AI来优化商品案牍、优化商品查找,并且进一步开端测验让AI承接更多原本需求由人来进行的作业。

我不知道AI会不会让你失业,可是善用AI的团队和公司接下来一定会有更高的功率和产出。无论你是产品司理仍是工程师,是产品运营仍是美术设计,在这一轮AI浪潮下,你的作业性质都会产生根本性的改动。AI会像一个助手相同随时陪伴在咱们身边,随时帮咱们处理简略的知识性作业,甚至在许多时分给咱们构思性的启示。

GPT来了,跑步迎接AI爆发的时代

[reference_begin]注:这是我让Midjourney画的Sam Altman和机器人开一个座谈会的图片,除了那个在空中漂浮的话筒,其他的一切都如同真的相同。[reference_end]

英伟达的创始人黄仁勋先生说,ChatGPT的发布堪称是人工智能工业开展的 “iPhone 时刻”。而要我说,整个AI根据根底大模型开展出来的才能,堪比一次工业革命。当然,这个改动对许多人的作业生涯来说,也是一场危机。可是就像丘吉尔所说的,“不要浪费一场危机”,尽早去拥抱这个改动,你就有时机像在2008年App Store发布的时分去学习移动App开发相同,把握住未来的时机。

经过实践学习新一代AI运用开发

那么,这门课程将怎么协助你学习新一代的AI运用开发呢?

**首先,这门课程不是一个理论课程,而是一个实践课程。**每一节课,咱们都会提出一个需求处理的实践问题。比方,用户关于商家评论的情感剖析,可以记住上下文的谈天机器人,怎么经过用户输入的关键词查找图片等等。而伴跟着这个问题的,则是经过几行或许几十行代码处理问题的整个进程。

一切的这些代码,根本都可以经过在线的Notebook的办法运转,不需求你在自己的电脑上搭建开发环境。即使你是一个产品司理或许事务方,你也可以自己动手体会到新一代的AI运用,开发起来是多么的简略便利。

**其次,这门课程不只仅对OpenAI的API的解说,咱们既会去测验一些开源模型,也会去掩盖语音、视觉的运用场景。**我不只会给你一个打字谈天的机器人,也会带你体会语音辨认、语音组成、AI作画等一系列运用开发的进程。咱们不只会运用OpenAI的API这样快捷的办法,也在特定场景下会选用本地部署的开源模型,甚至是根据你具有的数据去微调这些模型。

**第三,我不只会告诉你现在AI有什么才能,还会教你实践运用AI的套路。**比方分类、查找、引荐、问答这些问题,应该怎么用现有模型的才能来处理,有什么固定的形式可以处理这些问题。你可以马上把这些办法和套路放到你现有的事务体系里,马上经过AI给你的运用进步体会与功率。

**最终,跟着课程的推进,你会看到组合多个API、开源模型和开源库去处理杂乱的实在问题的场景。**假如你想完成一个电商客服,你不只需求检索知识库和问答的才能,同样需求去连接你现有的订单和物流信息的才能。如安在AI运用的开发进程中,将杂乱的事务流程串起来,不是简略地调用一下API就能做到的。可是在学习完这个课程之后,信任这些对你都不再是难事儿了。

那针对这四个目标,我把课程分成了3个模块。

  • 第一个模块,是根底知识篇。这儿,我会带你探求大型言语模型的根本才能。经过提示语(Prompt)和嵌入式表示(Embedding)这两个中心功能,看看大模型能帮咱们处理哪些常见的任务。经过这一部分,你会了解OpenAI的API,以及常见的分类、聚类、文本摘要、谈天机器人等功能,可以怎样完成。
  • 第二个模块,是实战进步篇。咱们会开端进入实在的运用场景。要让AI有用,不是它能简略和咱们闲谈几句就可以的。咱们期望可以把自己体系里边的信息,和AI体系结合到一同去,以处理和优化实践的事务问题。比方优化传统的查找、引荐;或许进一步让AI辅助咱们读书读文章;甚至于让AI自动根据咱们的代码撰写单元测试;最终,咱们还可以让AI去决策运用调用什么样的外部体系,来协助客户处理问题。
  • 第三个模块,咱们来要点重视语音与视觉。光有文本对话的才能是不够的,我会进一步让你体会语音辨认、语音组成,以及唇形可以配合语音内容的数字人。我还会教会你怎么使用现在最流行的Stable Diffusion这样的开源模型,去生成你所需求的图片。并在最终,把谈天和画图结合到一同去,为你供给一个“美工助理”。

期望这个课程,可以教会你高效使用新一代AI强大的才能,去处理实在场景下的问题。假如你是一个工程师,你可以马上把学到的代码、办法和模型用到你的作业里去。假如你是一个产品司理或许事务人员,信任你也能从这个课程里,了解到AI可以做的工作,以及现在做起来能有多简略。

马上动手,拥抱新时代的“通用人工智能”

OpenAI的创始人Sam Altman说,他觉得“通用人工智能”(AGI)现已离咱们不远了。在投入了许多的时刻去体会、运用和学习AI最新的开展之后,我也现已信服了这个观念。

人工智能是在计算机的创造之后没多久就呈现的一个范畴。说实话,作为一个早早就触摸和进入到这两个范畴的幸运儿,之前我从来没有想过在有生之年会看到“通用人工智能”有完成的或许性。

而当“通用人工智能”真的有或许呈现在咱们面前的时分,我是反常兴奋的,从前被浇灭过的热心重新燃烧了起来。曩昔的几个月,或许是我最近几年以来,写代码、读论文、看视频最多的一段时刻。我也期望能把这些让我时时刻刻都充满热心和浪漫幻想的科学技能共享给你,和你一同去拥抱一个归于AI的新时代。

期望这门课,不只仅是让你了解到AI范畴运用开发的知识和办法,更能激起你们的构思和热心,去开发你们用得上的AI产品,对你们日子的每一天都做出改动!最终欢迎你的参加!

文章来历:极客时刻《AI大模型之美》