编者按:现在大模型近乎能够协助人类处理方方面面的作业,如对话、写文章、写代码等等。在大模型“狂飙”趋势下,想要从事AI范畴的小伙伴或许会犹疑:现在进入AI范畴会不会现已太晚了?
本文作者结合自身转型阅历和对AI市场的研判,阐述了进入人工智能范畴从来都不会太晚,There’s no time like the present。
本文还详述了,在“AI浸透全部”的年代,怎么快速掌握必要的AI常识,以及怎么在AI年代找到自身作业定位。
以下是译文,Enjoy!
作者| swyx
编译 | 岳扬
我的一位开发者朋友最近跟我说:“假如我现在是20岁,我会放下全部 all in 人工智能。”但他现已花了十多年的时刻去学习专业常识、积累交际人脉和良好的声誉,现已到达他现在地点范畴的最高水平。因此,他现在还得留在原来的范畴。另一位较年长的大学时期朋友是一家上市科技初创公司的高管。他对现在的作业称心如意,具有近乎完美的简历,他之前的作业阅历也是令人羡慕的岗位。可是,他现在正在改变方向,由于正如他告知我的那样,”生命是短暂的”,他不想在结束时想 “假如其时…”。
最近几天,我同从事技能作业和非技能作业的朋友都有过相似上面这样的对话。尽管我很想让这篇文章重视详细的技能发展和分享飞速发展的最新技能,但我以为有必要花一期来评论作业转型论题,由于这正是我凑巧特别有资格能够评论的论题。
01 三十多岁时的转折期
我还记得在我30岁第一次进行作业转型时有多么可怕,其时我现已在金融作业作业了6-7年,我从16岁起就一直想要从事金融作业,络绎于国际各地,向CEO们提问,并协助办理一家国际尖端对冲基金的10亿美元财物。看起来我很厉害,但我深知我的心里并不满意,这不是我的最终目标。与从无到有创造出一些东西比较,让一些捐赠基金和养老金的数字变得愈加大,就显得微乎其微了。我决议从金融作业转向软件工程(和开发者关系) 。接下来产生的咱们都现已知道了[1]。
六到七年后,我又一次改变了我的作业。我以为从软件工程师(SWE)到人工智能(AI)的改变简直和从金融到软件工程师的改变相同大,它们仅仅表面上看起来相似(都是计算机范畴),可是需求许多的新常识和实践经验才能使作业变得有效率。我的改变战略和上次相同:尽或许开端的六个月每个晚上和周末学习,以确保我对要进入的范畴具有稠密的爱好(注释1,文末有解释,后同),并且我能够取得有意义的进步,然后就开端与曩昔say goodbye/背水一战/竭尽全力,并告知咱们我进入了这个范畴[2](注释2)。
但那仅仅适用于我自己的情况。每个人的情况或许都会不同。我信任假如你乐意,能够找到怎么做到成功转行的方法。这篇文章面向的对象是那些想要取得满足自信去做出决议的人。
我以为,在科技作业的挑选中存在许多隐藏的年纪歧视(ageism)和沉没成本误区[3](sunk cost fallacy)。因此,以下是我快速列出的一些理由,能够阐明你不会由于年纪问题而无法转行。
02 哪怕你年纪现已很大 仍应进入AI范畴的原因如下
2.1人工智能极大的潜力/发展速度
- 杰夫贝索斯(Jeff Bezos)在30岁时辞去金融作业,创办了亚马逊。
- 他这样做是由于1994年互联网运用量每年增加2300%。
- 通用技能[4](general purpose technologies)(注释3)的推广需求数十年的时刻。
- 幻想一下,假如你能够在2000年或2010年成为技能范畴的“后浪”,却得出结论以为“为时已晚”而没有进入互联网作业。
- 自1月以来,ChatGPT的运用量增加了1000% [5](注释4)。
2.2 上手AI需求的时刻比咱们幻想的要短
-
假如不是经过获取博士学位的路径进入机器学习范畴,需求先参与Andrew Ng (吴恩达)在 Coursera 上的课程[6]三个月左右,然后就会意识到仍需求数年的自学和实践经验才能在机器学习范畴做出风趣的作业。
-
但现在咱们掌握生成式AI的学习路径正在变得越来越简略。(注释5)
-
Jeremy Howard 的 fast.ai 课程[7]从 2016 年开端就宣称让学生在七周内进入人工智能范畴。到了 2022 年,他现现已过十节 90 分钟的课程带领学员重新完成 Stable Diffusion[8]。Suhail Doshi 在 2022 年 6 月参与了这门课程,到了 11 月就推出了 Playground.ai[9]。
-
这在必定程度上是由2017年推出的Transformer架构推进的,自那今后它简直进入了每个 AI 范畴[10],并供给了一个强大并且灵活的 baseline,从而使之前的架构常识变得可有可无。因此,没有数十年的研讨需求学习,只需求学习最近五年的内容。
www.stateof.ai/2018
- 有一些读者询问了关于AI涉及到的数学问题。AI 是否“仅仅运用了矩阵乘法(matrix multiplication)” [11]存在争议,假如你乐意,能够在大学线性代数和微积分课程中学习矩阵乘法,但我的回答是你不用这样做,现在的那些AI开发框架(比如 Pytorch) 能够协助你进行任何反向传播(backpropagation)和矩阵操作(matrix manipulations)。
- 当然,走捷径并不能让你变成能够推进技能发展的博士。 但看看最顶尖AI研讨员的作业生涯,你也能够了解需求多长时刻才能到达最高水平。Yi Tay在 Google 奉献或领导完成了许多最新的 LLM 成果,但你或许会惊讶地发现他才取得博士学位约 3.3 年的时刻。Ashish Vaswani在宣布 Transformer 论文时距离博士毕业也只要 3 年,而Alec Radford宣布 GPT 和 GPT-2 论文时刚本科毕业 2 年。
- 相似这样的作业轨道在物理、数学、医学等更成熟的范畴不会产生,由于它们的 “FOOM(Fast Onset of Overwhelming Mastery) ” 年代[12]现已曩昔了几个世纪,而 AI 的“foom” 正在明显地产生。
- 这些话都是为了阐明:这仍然是一个非常年轻的范畴,在20年后,没有人或许会关心你觉得自己“晚入行”。
2.3除了成为专业的机器学习范畴的研讨员,还有许多范畴能够挑选
- Prompt和大模型才能研讨: Riley Goodside[13]的作业生涯在 2022 年急剧变化,经过在推特上发布GPT-3的运用技巧,他从 Grindr 的数据科学家变成了国际上第一位高级Prompt工程师[14],他还发现并遍及[15]“提示注入(prompt injection) ”这种重要的 LLM 安全问题。自那今后,许多人现已意识到寻找 GPT-3 和 GPT-4 的风趣运用案例在交际媒体上很受欢迎。
- 软件工程范畴: 最近,Whisper.cpp和 LLaMA.cpp 激发了许多人对在用户终端上运转大型模型的爱好[16]。我听了 Georgi Gerganov 在 Changelog 上的采访[17],并得知他在 2022 年 9 月自称“非 AI 信仰者”,仅仅为了好玩而将 Whisper 移植到了 C++。LLaMA.cpp的发展速度比 Stable Diffusion 还要快[18],而 Stable Diffusion 现已是有史以来增加最快的开源项目之一[19]。尽管没有进行模型练习,但 Georgi 的软件工程专业常识使得这些根底模型愈加易于接入。Harrison Chase 的Langchain[20]经过构建首个面向全部开发人员的提示工程框架,将Prompt和软件的改进融合到预练习的LLM模型中,招引了许多重视。从 Guardrails 到 Nat.dev 的一系列 LLM 工具都有助于弥合这些模型从学术界到商业应用的差距。ChatGPT自身在很大程度上是与GPT 3.5系列模型一同交付的用户体会立异,这对前端/UI开发者来说是个好消息。
- AI技能产品化: 提到 Stable Diffusion,Emad Mostaque直到 2019 年都是一名对冲基金经理[21],似乎除了为他的儿子进行“literature review of autism and biomolecular pathway analysis of neurotransmitters[22]”相关的研讨之外之前并没有任何 AI 经验。但他在 2020 年参与 EleutherAI 社区后意识到 Stable Diffusion 这样的东西是或许存在的,并找到了海德堡大学 CompVis 组[24]的 Patrick 和 Robin[23],供给了大约 60 万美元来练习和交付了2022年第二或最重要的AI产品。没有人想去审查谁做了什么,但一个前对冲基金经理经过发现机会并将财务(和组织架构)杠杆应用于时机已到的主意(ideas whose time had come)而取得许多报答是有道理的。Nat Friedman现已公开表示,多年的研讨形成的才能过剩[25]还没有被满足多的创业公司消化,看起来像 Dave Rogenmoser 这样乐意早早跳上这班车的创业人,在两年内将 Jasper 的 ARR(管帐收益率) 从零增加到了 7500 万美元[26],将会取得不成比例的报答。
现有企业和各个垂直范畴的创业公司都在拥抱人工智能,这表明未来将是“AI浸透全部”的年代,因此理解根底模型或许是到达目的(使用它们)的一种手段,而不是目的自身(练习模型或对安全性和感知才能进行思考) 。少想一点你自己和你未来的潜在方向,不是“转行研讨AI”,而是在你现已感爱好或精通的范畴 “学习怎么使用它”。
我最后一个与年纪相关的呼吁是通用的——应战自己对大脑是有利的。人们普遍以为神经可塑性(Neuroplasticity)在25岁今后就会停止,但这是有争议[27]的。更为广泛的一致是,继续学习有助于建立认知储备(cognitive reserve) ,有助于防止像发呆和阿尔茨海默病这样的恶性神经退行性疾病。
你是否正在处理任何相似于了解AI的作业,并想方设法将其运用于实际应用中的应战?
03 我是怎么学习人工智能的
我现已完成了fast.ai的课程内容,但也在继续重视我自己筛选的Twitter列表中的从业者[28],并将笔记放入我的公开地GitHub AI库房[29]和Latent Space Discord中[30]。大多数比较重要的新论文 在它们被发布的那周我就开端阅览,我还尽或许地运转取得许多点赞的项目和产品的代码或阅览它们的代码。咱们即将在播客上发布“Fundamentals 101”系列内容,其中包含AI根底常识,这迫使我去阅览更多论文并了解一些咱们今天以为理所当然的作业的历史(注释6)。
github.com/sw-yx/ai-no…
注释:
-
在两次作业转型中,我都并不是从零开端 – 我在13岁时就接触过BASIC编程,在26岁时作为期权交易员作业时,写了一些极端简略的自然语言处理代码来解析经纪商的定价 – 我希望我能向你展示,但现已曩昔太久了,这些内容现已找不到了。
-
在社区中公开宣布学习进程内容能够到达人类最快的学习速率 – L((PN)^2)![31]
-
这股AI浪潮是如此之大。不要信任我的话,听听比尔盖茨的话[32],他说这是自图形用户界面以来最重要的技能进步。
-
隆冬将至。在某一天,这个AI盛夏将结束,AI隆冬[33]将再次到来。了解这股AI浪潮的重要性在于它或许会在任何隆冬中存活下来,就像2001年经济衰退后互联网作业仅仅短暂地停顿了一下。
-
强制运用生成式AI(Generative AI) 这个术语会让咱们感到不愉快,由于咱们都以为它被过度炒作了[34]…可是现在还没有找到更好的替代词。
-
再次强调,在公开的社区宣布学习内容很重要,由于忧虑影响我的个人声誉,我会尽或许正确,并让我在犯错时感受到额定的压力。
END
参考资料
[1]learninpublic.org/
[2]www.swyx.io/learn-in-pu…
[3]thedecisionlab.com/biases/the-…
[4]en.wikipedia.org/wiki/Genera…
[5]twitter.com/swyx/status…
[6]www.coursera.org/specializat…
[7]www.fast.ai/posts/2016-…
[8]www.fast.ai/posts/part2…
[9]twitter.com/Suhail/stat…
[10]twitter.com/karpathy/st…
[11]twitter.com/search?q=%2…
[12]www.latent.space/p/ok-foomer
[13]www.linkedin.com/in/goodside…
[14]twitter.com/swyx/status…
[15]twitter.com/goodside/st…
[16]news.ycombinator.com/item?id=351…
[17]changelog.com/podcast/532…
[18]twitter.com/ggerganov/s…
[19]a16z.com/2022/11/16/…
[20]langchain.com/
[21]en.wikipedia.org/wiki/Emad_M…
[22]twimlai.com/podcast/twi…
[23]research.runwayml.com/the-researc…
[24]github.com/CompVis
[25]stratechery.com/2022/an-int…
[26]techcrunch.com/2022/10/18/…
[27]www.goodtherapy.org/blog/change…
[28]twitter.com/i/lists/158…
[29]github.com/sw-yx/ai-no…
[30]discord.gg/xJJMRaWCRt
[31]www.swyx.io/big-l-notat…
[32]www.gatesnotes.com/The-Age-of-…
[33]en.wikipedia.org/wiki/AI_win…
[34]www.latent.space/p/why-promp…
本文经原作者授权,由Baihai IDP编译。如需转载译文,请联系获取授权。
原文链接:
www.latent.space/p/not-old