《深度浅出AIGC(二):分散模型原理》

个人主页: GoAI | 公众号: GoAI的学习小屋 | 沟通群: 704932595 |个人简介 : 签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星方案计算机视觉方向导师等,专注大数据与人工智能知识共享。

文章目录

《深度浅出AIGC(一):分散模型简介》

《深度浅出AIGC(二):分散模型原理》(本篇)


深度浅出AIGC(二):分散模型原理

本篇导读:本系列主要介绍AIGC方向文章,包括stable diffusion分散模型介绍、文生图、图生视频等方向理论与基础实战,共享AIGC开源东西的运用,该系列合适便利小白学习,本篇为第二篇《 深度浅出AIGC(二):分散模型原理》。

Stable Diffusion 总结

以最简单的方式来说,Stable Diffusion是一个文本到图画的生成模型。给它一个文本指令作为输入,它将回来给你一张与输入指令匹配的图画。

《深度浅出AIGC(二):分散模型原理》

分散模型(Diffusion Model)

安稳分散模型(Stable Diffusion)归于深度学习模型中的一个大类,即分散模型。它们归于生成式模型,这意味着它们是被设计用于依据学习内容来生成相似的新的数据的。对于安稳分散模型而言,新的数据即为图画数据。

为什么称之为分散模型?因为模型中运用的数学看起来与物理学中的分散公式非常相似。咱们来了解一下这个模型的理念。

假定咱们只运用猫和狗这两类图画来练习这个安稳分散模型。如下图所示,图中左侧曲线的两个峰值代表了猫与狗这两组图画。

《深度浅出AIGC(二):分散模型原理》

前向分散进程将图片变成噪声图

前向分散(Forward diffusion )

所谓前向分散(forward diffusion)进程便是向练习图画中不断地增加噪声,然后使其逐步变为一张毫无意义的纯噪声图。在咱们的比如中,前向分散进程会将猫与狗的图片转变为噪声图。终究你将无法从得到的噪声图中分别出原来的图究竟是猫还是狗(这点很重要)。

这就好比往一杯水中滴入一滴墨水。墨滴将在水中分散,在几分钟之后,它将随机均匀的遍布于整杯水中,你将再也无法从这杯水中看出原来的墨滴究竟是从杯子的中心还是边缘滴入的了。

下图演示了一张图画经由前向分散逐步变为纯噪声图的进程。

《深度浅出AIGC(二):分散模型原理》
ng)

一张猫图的前向分散进程

逆向分散(Reverse diffusion)

现在来到奇特的部分了。假如咱们可以反转分散的进程会怎样呢?就像影片倒带相同,在时刻线上逆向移动,那咱们终究将会看到墨滴最初是从哪里滴落的了。

《深度浅出AIGC(二):分散模型原理》

逆向分散进程将图片从噪声图中还原

从一张彻底无意义的噪声图,逆向分散进程使其还原为一张猫【或】狗的图画,这便是逆向分散的核心理念。

从技术上来说,每个分散进程都有两个重量:(1)漂移或引导的方向;(2)随机的方向。逆向分散会将结果导向猫或许狗的图画,但并不会是二者之间的图画。这也是为什么我上面说,逆向分散的结果将会是猫或许狗。

练习是是怎样完结的

逆向分散的理念是如此的高超与高雅,可是真实有价值的问题是,怎样来完成它呢?

为了将分散进程反转,咱们需求知道到底有多少噪声被增加到了图画中。而这个问题的答案,将会由一个经过练习的神经网络模型来猜测回答。在Stable Diffusion模型中,这个模块被称为噪声猜测器(noise predictor)。练习的进程如下:

  1. 选择一张练习图片,比如一张狗或猫的图画
  2. 生成一个随机的噪声图
  3. 将这张噪声图画原始练习图片中增加特定次数,使图画变得喧闹
  4. 以正确答案为基准,经过调试参数,练习噪声猜测器终究可以识别出究竟有多少次噪声被增加到了这张图片中。【译者注:即一个标准的有断定的神经网络练习进程】

《深度浅出AIGC(二):分散模型原理》

噪声是逐步增加到图画中的,噪声猜测器将预估每一步中累计被增加噪声的总和

在练习完结后,咱们将得到一个可以估量出有多少噪声被增加到了一张图画中的噪声猜测器。

逆向分散(Reverse diffusion)

现在咱们有了一个噪声猜测器,咱们将怎样运用它呢?

咱们将首先生成一张彻底随机的图画,并让噪声猜测器告诉咱们这张图画中被增加了哪些噪声。随后咱们就可以将噪声猜测器给出的噪声图画从原始图画中剔除出去【译注:即反向的图画叠加操作】。重复以上进程几回,咱们即可以得到一张猫或是狗的图画了。

《深度浅出AIGC(二):分散模型原理》

逆向分散经过将猜测的每一步的噪声逐步从图中减去,终究得以还原图画

你或许注意到了,按上面的描述,咱们所完成的逆向分散进程无法操控终究结果是一个猫还是狗的图画。在后面的“调理”章节中咱们会着重来论说这一点。就目前咱们所介绍的内容来说,图画的生成是无条件的(unconditioned)

本篇总结: 本篇《深度浅出AIGC(二):分散模型原理》主要总结分散模型原理,包括前向分散、后向分散及练习怎样完结,后续将继续介绍AIGC相关内容。

参考资料

  1. 《分散模型从原理到实战》
  2. stable-diffusion-art