本文正在参加 人工智能创作者扶持方案 ”

欢迎重视我的大众号 [极智视界],获取我的更多经验共享

大家好,我是极智视界,本文介绍一下 GPT4来了,ChatGPT又该晋级了,更多的是个人考虑。

邀您参加我的常识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:t.zsxq.com/0aiNxERDq

从 ChatGPT 发布 (2022年11月30日) 到现在现已差不多三四个月的时间了,实话实说现已火的”一塌糊涂” ,其影响力早已超出了AI领域,乃至好像要给人工智能带来新一轮的革命。从 ChatGPT 火爆至今,按理来说,我作为一名人工智能领域的创作者,早就应该来 “凑凑热闹”。但考虑到自身我输出的文章愈加偏”干货”一些,所以我其实并不太想写一些过于 “花里胡哨” 的东西,所以一向也没太想”蹭蹭” ChatGPT 的热度。

现在热度过了这么久了,我也想能够适当输出一些关于”它”的文章,以佐证我仍是一名 AIer。这篇文章其实愈加多的会写一些我个人关于 ChatGPT 的考虑,特别是针对 GPT4 发布之际,一些新的考虑。

正如上星期微软德国首席技能官 Andreas Braun 的预告,OpenAI 将在这周发布 GPT-4,现在 GPT-4 也如约而至,考虑到 GPT-3.5 和其的”衍生物” ChatGPT 的火热,GPT-4 的发布也必将再在AI界掀起来新一波的 “腥风血雨” (这有点像新一代 iphone 发布那样)。

极智AI | GPT4来了,ChatGPT又该升级了

关于 GPT-4 的发布,先让咱们来 cc OpenAI 的官网是怎样说的:

极智AI | GPT4来了,ChatGPT又该升级了

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks.

短短的几句介绍里,却有相当炸裂的点:承受图画和文本输入,输出文本输出。这意味着行将打破 ChatGPT text-to-text 纯文本的问答形式,也意味着晋级后新版的 ChatGPT 可能会同时支撑文本的发问&&图画发问多模态方式,这是一种跨越式的前进 (顺便提一句,尽管这在其他多模态大模型中早已司空见惯)。比如咱们应该能够直接供给一道数学解三角函数的题,标题可能会包含数学图形关系,这应该也难不倒以GPT-4作为基座进化后的 ChatGPT 了,而这关于现在的 ChatGPT 来说,它其实根本 “看不见” 图画里的表达 (你能够简略理解为:现在的 ChatGPT 只会说话,但是它并没有眼睛)。

另外比较于 GPT-3 或许 GPT-3.5,GPT-4 极大地提高了杂乱表述问题、杂乱逻辑问题的处理才能,愈加特别的是,GPT4 还极大提高了其数学问题的处理才能,它乃至能够很好地处理一些奥数的问题,而数学处理才能在目前的 ChatGPT 里也一向被人诟病。

所以全体来看,GPT4 不只是在”纵向开展”,还在”横向拓展” 。”纵向开展”的意思是它在自身就拿手的纯文本问答中的才能继续加强,包含对杂乱表达、杂乱逻辑和数学问题处理才能的提高,这是它的 “看家本领” / “本职工作”。在此同时呢,它还带来了新的”技能”,说的通俗一点就是 看图说话的才能,说的专业一点是 图画理解才能。GPT4 迈出的这一步足以看出 OpenAI 或许说 微软(毕竟在环绕出资两轮 OpenAI 后,两家差不多就是一条船上的了)的野心,这明白的再表明:ChatGPT想做一个真实意义上的 “Unified Vision-Language Understanding and Generation” 的大模型

而这会动了很多人的蛋糕,拿微软自身来说,它也有自身主打 视觉-言语大一统的大模型 BLIP,假如 ChatGPT 的开展在大一统的路上表现地愈加好,那 BLIP / BLIP-2 的开展就比较为难。按这样的节奏,假如在 GPT-4.5 或许 GPT-5 中推出 “Image Generation” 功能,凭借 ChatGPT 自身大量的活泼用户,那么像扩散模型、国内太乙 (注:这些大模型主打图画生成) 的生存空间又在哪里呢,再假如加上视频理解、视频生成功能呢。

所以假如说 transformer 把视觉-言语进行了大一统,那么按照 ChatGPT 这样的开展,现已不仅仅是视觉-言语任务的一致了,它还要一致模型!

Transformer 打响了视觉-言语大一统的前奏,而或许,ChatGPT 才是真实大一统的到来。

好了,以上共享了 GPT4 来了,ChatGPT 又该晋级了,更多的是个人的一些考虑。期望我的共享能对你的学习有一点协助。


 【大众号传送】

《极智AI | GPT4来了, ChatGPT又该晋级了》


畅享人工智能的科技魅力。邀请您参加我的常识星球,星球内有丰富的AI技能使用相关技能文章、资源、项目源码,包括人脸、检测、分割、多模态、自动驾驶、工业等实用、好玩的项目使用,一定会对你的学习有所协助。t.zsxq.com/0aiNxERDq

极智AI | GPT4来了,ChatGPT又该升级了