不管是2022年11月30日上线的ChatGPT,仍是最近 OpenAI 正式发布的迄今为止规划最大、功能最强悍的多模态预练习模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强壮威力,宣告了强人工智能年代的到来。在这场人工智能引发的破圈热烈之下,咱们难免要进一步深化思考一个问题,为什么这么多年曩昔了,引领工业技能革新的依然是美国而不是我国?
2021年,我国以全球AI顶级会发表的论文数27.6%的份额高居榜首,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。不管AI人工智能论文发表量仍是专利申请量,我国在全世界范围内都独占鳌头,那么按道理来说我国在AI人工智能范畴的研讨既广泛又深化,像ChatGPT这样具有里程碑意义的人工智能使用应该在我国诞生才对。尽管说自然言语理解和生成是人工智能研讨范畴的一座高峰,想要攀爬和征服就需求继续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研讨机构也在做类似的工作。不过很遗憾,终究仍是美国的OpenAI率先发布了强壮的ChatGPT。今天咱们试图客观的剖析下是什么原因造成了咱们没有成为新一代技能革新的发起人,今后咱们应该怎样做才干成为未来技能的引领者而不是跟随者。
原因剖析
或许是由于曩昔我国二十年互联网的蓬勃开展,国内一些互联网巨头公司的市值能够在国际上和美国的互联网公司掰手腕了,让咱们发生了不少的幻觉,误认为在技能上咱们也能够和美国一较高下了,可是现实真的如此吗?
信任大家在新闻中经常能够看到,这几年为了遏制我国开展,美国政府不断向我国高科技职业挥舞制裁大棒。比如向我国华为公司施行技能封闭,以国家安全为由,制止美国公司向华为出售技能和设备。一时刻我国的高端芯片职业哀鸿遍野,遭受技能卡脖子危机。咱们在感叹美国政府无耻的一起,也为本身没有预先布局底层技能研讨以及系统构建而感到扼腕叹息。这次OpenAI发布的ChatGPT以及GPT4又给咱们上了一课,越来越多的人认识到我国和美国的技能距离何止高端芯片,前沿的人工智能技能、强壮的算力网络等等诸多高新技能方面都和美国有不小的距离。美国政府镇压我国高科技职业开展这一巴掌,终于把一些还对美国抱有幻想的技能人彻底打醒,不管高端芯片仍是前沿人工智能等中心技能买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚决了咱们和美国有关的技能类别有必要全部完结国产化替代的决心。
过度关注商业模式,忽视底层技能研讨
在曩昔的20年傍边,我国互联网职业处在高速开展阶段,据CNNIC(我国互联网络信息中心)陈述,到2022年12月,我国网民规划达10.67亿。跟着互联网在线人数的继续攀升,各种各样形状的商业模式在这片热土上不断得以验证以及开展壮大。移动支付、电商物流、外卖打车、短视频等商业形状深入改变了老百姓的日常日子方式,为大家带来了极大的日子便利以及文娱消遣,一起也提升了整个社会的效率。但与此一起,各大互联网公司如同都沉浸在怎样开展新商业模式以及保护已有商业格局的怪圈中不可自拔,简直所有的精力都放在事务内卷上。因而投入底层技能研讨的时刻和资源相对就会被挤压乃至是彻底没有,终究导致被他人技能卡脖子的概率大大提升,一起能够发生颠覆性立异技能的可能性却大大降低。
比照中美两国技能开展道路,咱们能够发现一个有意思的现象。在我国,技能的开展大都是围绕事务进行,也便是说当一个事务模式被推出来之后,假如想要支撑这样的事务规划就需求开展什么样的技能,那就研讨和开展什么技能,通过商业模式的立异、事务的开展推进技能向前开展演进。
可是美国如同正好相反,常常是一项技能的开展前进反向催生出新的商业形状。就拿推出ChatGPT的OpenAI公司来说,它本来便是一个非营利性的技能安排,集结了AI人工智能界的各路大佬,初衷便是让人工智能向着友爱的方向开展,中心主旨在于“完结安全的通用人工智能(AGI)”,使其有益于人类。GPT模型经过不断的迭代晋级终究搞出来了ChatGPT,有望成为未来人工智能使用技能的根底底座,因而未来可能将会有海量的上层使用都是基于ChatGPT来进行构建,能够毫不夸大地说,ChatGPT或者说通用大模型或许便是人工智能范畴的操作系统,将来会诞生多少新的的商业模式以及事务形状不可估量,这种技能革新是自下而上的颠覆性立异将会对未来的工业形状发生深远的影响。
而咱们太关注上层使用商业模式的立异了,然后忽略了底层技能的研讨。咱们似乎在一次又一次的电商大促、一次又一次的短视频文娱中逐步迷失了方向,表面上的热烈掩盖不了底层中心技能的匮乏。其实想想就背面发凉,当下不管是互联网技能、人工智能技能等前沿技能如同都是建立在他人的技能底座之上的。那些曾经咱们引认为豪的移动支付、电商物流等等不过是这些底层技能的上层使用而已。假如被人家釜底抽薪,那真的就玩不转了。所以底层技能真的非常重要,能够说没有底层技能的支撑,所有上层的使用都是海市蜃楼。
缺乏长时间主义
或许是国内竞争压力太大了,不管是个人仍是公司,都恨不得今天投进去资金,明日就能看到成果和收益。假如在短期看不到收益的项目,一般公司实际上很难有继续的资源投入,更别提看不到明确报答周期的根底技能研讨了。浮躁的氛围,层出不穷的技能噱头,表面上的热热烈闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真实静下心来进行长时间的技能研讨。又有多少公司能够有马教师那样的气魄和实力每年10个亿连投10年,终究投出来个阿里云。
说到这儿,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始呈现的时候受到了极大的关注和资本的热烈追捧。可是当热头曩昔之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技能深度优化研讨呢?不能说彻底没有但绝对是屈指可数,与其说是他们追捧高新技能,不如说他们追捧的是怎样快速赚钱的东西。至于究竟是VR、元宇宙仍是ChatGPT其实都无所谓,对他们来说其实便是个技能称号而已。
可是实际上不管是ChatGPT仍是GPT4这样的人工智能使用,都不是横空出世的,它们都是在GPT、GPT2以及GPT3根底上逐步迭代开展而来的,这其间耗费了多少顶尖人工智能专家长时间坚持的汗水以及许多资金的继续投入。OpenAI在取得微软出资之前的三四年里烧掉将近1亿美元,才搞出来一个以GPT第一代模型为根底的雏形,当时还远远达不到ChatGPT今天的作用。根底技能研讨不是一朝一夕就能完结的工作,它需求不断的试错,需求对未来技能开展趋势的独特眼光,更加需求长时间主义的坚持。不过让咱们感到欣慰的是,阿里巴巴、华为在技能研讨上的投入现已每年超越1000亿,信任在不远的将来必定会有新的技能打破呈现。
缺乏技能系统支撑
就好比高端芯片制作,其间涉及芯片规划、芯片制作以及封装测验都是一整套杂乱的工艺缺一不可。同样通用大模型也是一个杂乱的系统工程,而通用大模型的练习离不开海量的高质量练习数据、优秀的深度学习算法以及强壮的算力资源支撑。ChatGPT的成功得益于高质量的标注数据,OpenAI为了取得高质量的练习数据雇佣了超越40家承包商进行数据标注,这在国内简直是不敢想象的工作。另外以ChatGPT在2023年1月的独立访客平均数1300万核算,其对应芯片需求为3万多片英伟达A100 GPU,假如没有巨大的算力支撑,很难练习出高质量的通用大模型。
也便是说,通用大模型的练习需求一个完好的人工智能技能系统来进行支撑,不然即便有先进的算法,但怎样取得高质量的练习数据,到哪里去找巨大的练习算力资源,这些都是摆在通用大模型练习面前有必要要处理的问题,不然没有高质量的数据以及算力支撑也是巧妇难为无米之炊。
怎样破局
通用大模型是未来人工智能的重要开展方向,咱们肯定要加大资源投入力度才干有机会在未来人工智能前沿技能的竞争中占有一席之地。那咱们应该怎样做才干破局呢?我想能够从以下几个方面入手。
数据方面
尽管当时中文在线联网数据也算是海量,可是数据质量遍及不高,一起数据孤岛问题比较严重。假如咱们想基于中文数据来练习通用大模型,就有必要对中文在线数据进行管理提高中文在线数据质量,处理数据孤岛问题,推进完结数据的共享和互联互通。
算力建造方面
结合国家东数西算工程,协调各个区域的算力中心,构成全国通用算力根底设施,加快构建国家级一体化新式算力网络系统,为通用大模型练习供给源源不断的强壮算力支撑。只要这样,才干满足大模型练习所需求的算力要求,一起为强人工智能年代的到来做好算力资源储备。
意识方面
和他人的技能距离,咱们当然要尽力补偿。不过咱们需求注意的是咱们在前进,他人也在前进,所以咱们光追赶他人不行,还要有更加久远的眼光,要有关于未来精确的判断力,进行提前技能验证以及工业布局,为下一次技能革新做准备,真实成为未来技能开展的引领者而不是追随者。
总结
科技的开展前进不是一朝一夕就能完结的,它可能需求一代又一代技能人员孜孜不倦地寻求。尽管咱们在许多范畴都现已取得了长足的前进,可是一起咱们也要清醒地认识到,在核算机范畴、互联网技能范畴以及人工智能技能范畴咱们还有不小的距离需求补偿。因而少一点网红、明星的曝光,多一点科技工作者勤奋务实地宣扬,尽力营造技能为先、科技为先的社会氛围才是未来科技职业蓬勃开展的社会环境根底。我信任假如咱们能够少一点浮躁,多一点朴实,或许下一次的科技革新便是在我国这片土地上诞生。最终和大家共享下马教师曾经说过的一段话,我觉得对咱们当下思考未来技能开展非常有帮助。
我一向觉得填补空白这句话是有问题的,不是由于欧美的便是先进的,便是咱们要去填补的。其实今天咱们不应该要和哪个东西接轨,习惯哪国的规范,填补哪个空白,今天咱们要思考的是怎样和未来接轨,怎样习惯未来的规范,怎样补偿未来的空白,咱们要想理解未来是怎样的,以及自己究竟要做成一个什么样的系统,然后再去看看他人怎样做,假如永远重复他人的言语,评论他人设定的主题,咱们不但会迷失现在,并且会错失未来。
本文正在参加 人工智能创作者扶持方案