一: AIGC的历史开展

在前两篇的文章中,我们介绍了AIGC的早期阶段和沉积堆集阶段中AIGC的起源,以及AIGC的理论和概念。那么这篇文章我们就简单的介绍下AIGC历史上开展的第三个阶段,也便是现在所在的阶段:AIGC(生成式人工智能)阶段

1.1 chatGPT

大家都知道,chatGPT打开了AIGC生成式人工智能的第一枪,瞬间爆火全球,从chatGPT3.0到3.5再到4.0等等正式宣告了生成式人工智能(AIGC)年代的到来。在这个新年代的潮流下,企业们都不想落下,都想在这一块新生的范畴内分的一块蛋糕。所以各种AI技能如雨后春笋般涌现,令人目不暇接,不知该怎么挑选,怎么挑选。但说实话现在的AIGC技能都有着必定的门槛,针对的是企业或许有开发根底的开发人员,对于一般大众而言,门槛还是稍高一些,所以接下来必定会有一些公司或许企业,对其AI技能进行封装,包成亲民、利民的软件,抢占用户商场。

1.2 AIGC:万物皆可AI生成

最近很流行的一句话,万物皆可AI生成。我还记得初听这句话时,是抱着怀疑的态度的,乃至有点不以为然。但后来我使用了github上的Stab Diffusion 在自己的本地上,搭建了一个本地环境,然后使用C站上的Loar模型,以及一些根底模型,试着生成了一下,哇哦,几乎不可思议,居然真的能生成各种类型的图片!下面我就放一张我自己生成的,给大家看看:

AIGC的多模态知识工程(三)

真的太神奇了,不管是整体还是局部,都令人冷艳。精致、可控是文图生成AIGC的一大优点,用户完全可以依据自己的喜欢来微调。

1.3 AIGC分类

AIGC的多模态知识工程(三)

二: 多模态AIGC大模型驱动的具身智能

最近,谷歌5620亿参数的PaLM-E,他们将实在世界的传感器信号与文本输入相结合,建立言语和感知的链接,然后再使用可控制机器人完成任务规划和物品操作。

他们使用PaLM-E进一步验证了“才智涌现”在多模感知和具身智能上的作用。

首要架构思想:

将接连的、可感知的调查数据 注入预先练习的言语模型的嵌入空间中,以使 其可以理解这些接连数据。这是通过将接连观 测数据编码为与言语嵌入空间中的言语符号具 有相同维度的向量序列来完成的。

这种接连信 息以类似于言语符号的方法注入言语模型中。

在机器人操作规划、视觉问答和字幕生成等任 务中进行了端到端的练习。

AIGC的多模态知识工程(三)