介绍
最近,Stability AI正式推出了全新的SDXL 1.0版别。经过我的实践测试,与之前的1.5版别比较,XL的作用有了巨大的提升,能够说是全方位的超越。不只在理解提示词方面表现出色,并且图片的构图、颜色烘托和画面细腻程度都有了很大的进步,实践出图作用堪比Midjourney。此外,该版别还继续选用开源的形式发布,对于喜欢自定义生成图片的用户来说是一个极大的福音。
在 SD WebUI上 运转时还有一个额定的惊喜,就是它直接支撑制作不同风格的图片,如下图所示:
图片来源:stable-diffusion-art.com/sdxl-model/…
看到这儿,我想一些大模型、Lora模型的确能够进入收回站了。
那么XL现在是怎么做的呢?比较之前的出图办法,SDXL选用了两步走的办法,先运用基本模型生成有噪声的潜在图,然后再运用精修模型进行降噪优化,官方给的处理示意图如下:
不过基本模型也是能够独立运用的。所以实践出图时也能够选用另一种办法,首要,运用基本模型生成所需输出巨细的潜在图;然后经过图生图的办法,运用精修模型和相同的提示词,重绘第一步生成的潜在图,以优化出图作用。这种办法略微慢一些,由于它要履行更多的处理。
实践运用时,需求留意以下几点:
-
负面提示:与1.5、2.0版别比较,负面提示不再像之前那么必要了。许多常见的负面词汇是无用的,比方“Extra fingers”。
-
关键词权重:对于SDXL模型来说,1.5版别的权重很高。假如你要复用1.5模型的提示,或许需求下降权重。削减权重的作用比增加权重更好。
-
安全分散:必定要运用safetensor版别的模型,它更安全,不会在你的机器上履行代码。
-
精修强度:为了取得最佳输出作用,请运用低强度的refiner。
-
Refiner:为了得到更好的作用,请运用一张有噪声的图片来运用refiner。
-
图画巨细:SDXL模型的原生巨细是10241024像素。尽管SDXL支撑不同的宽高比,但图画质量对巨细很灵敏。以下是Stability AI官方图画生成器的尺度,主张选用,假如需求更大尺度的相片,能够再运用高清化放大。
- 21:9 – 1536 x 640
- 16:9 – 1344 x 768
- 3:2 – 1216 x 832
- 5:4 – 1152 x 896
- 1:1 – 1024 x 1024
-
ControlNet:ControlNet现在只能在V1模型上工作,SDXL的支撑还在开发中。
免装置体会
不用装置,还有N多的模型能够直接运用,不只能运用SD XL,也能够继续运用SD 1.5;缺陷是不能装置插件。
访问地址:www.liblibai.com/
进入后,点击页面右上角的“在线Stable Diffusion”即可进入。
按照下边的过程操作即可。
留意第3步和第4步,这是和之前不一样的当地。
- 需求勾选XL Refiner才有精修,咱们能够对比下勾和不勾的作用。
- 挑选SDXL的模型后,宽度和高度默许变成 1024*1024。
同享下提示词:
提示词:street fashion photography, young female, pale skin, (look at viewer), sexy pose,(pink hair, white hair, blonde hair, long hair), ((high ponytail)),detailed skin, (detailed eyes:1.3), skin pores, (grin:1.1), skin texture, (Hunter green uniform, black skirt:1.4), long green sleeves,8k, real picture, intricate details, ultra-detailed,(photorealistic),film action shot, full body shot, in a shopping mall,realistic, extremely high quality RAW photograph, detailed background, intricate, warm lighting, high resolution,uhd, film grain, Fujifilm XT3
反向提示词:text, watermark, disfigured, kitsch, ugly, oversaturated, low-res, blurred, painting, illustration, drawing, sketch, low quality, long exposure, (cape:1.4), cartoon, 3d character
然后咱们就能够愉快的生图了,每天300张。不过由于是同享的服务,高峰期或许等待的时间比较长。
云服务器体会
以 AutoDL 为例,我已经发布了一个支撑 SDXL 的 Stable Diffusion WebUI 镜像,租借实例时挑选“社区镜像”,输入:yinghuoai,就能够挑选到这个镜像了。
没有AutoDL经历的同学,能够先看我这篇入门教程:mp.weixin.qq.com/s/dhklIMvkd…
留意SDXL现在需求的内存资源比较高(或许是SD WebUI在内存缓存了很多数据的原因,独自跑SDXL Demo的时分没有耗费这么多的内存),主张挑选内存在80G的主机,当然单价也会更高一些。后续我也会继续了解下如何下降它的内存和显存运用,如有爱好请保持关注。
现在 SD WebUI 发布版别运用的是前文介绍的先“文生图”、再“图生图”的办法,尽管操作上烦琐了一些,但测试出图比较稳定。操作办法如下图所示:
1、根底模型挑选这个:sd_xl_base_1.0.safetensors
2、提示词随意写点就行。
3、宽度和高度留意手动调整到 1024*1024,实测512出图是卡通图,作用也不怎么样。
这个镜像自带了一个风格插件,用于实现 Stability AI 官方绘图产品中的绘图风格功能,运用这个插件,能够制作不同风格的相片,看下边的选项很多,有3D、动漫、相片、数字、线画、插画、像素等很多风格。有了这个的确能够抛弃很多大模型和Lora模型了,所以说SDXL的确进步很大,主张咱们试试。
出图之后咱们能够在这儿把图片发送到“图生图”:
提示词都会带过去,留意这儿的根底模型要换成:“sd_xl_refiner_1.0.safetensors”。
重绘强度主张控制在:0.1-0.3,小了没作用,大了图片会变化过大。
别的参数不用动,然后就能够精修生图了。
不成熟的办法
咱们也能够感受到上边的过程比较烦琐,所以 SD WebUI 也在开发一个新的计划,类似哩布哩布上的体会,不过现在还是开发版,我这儿测试经常呈现溃散的问题,可是有人能够正常运转,所以这儿简略给咱们说下运用办法,有才能的能够去研讨下。
1、下载这个开发版别:github.com/AUTOMATIC11…
2、启动后在“设置”-“用户界面”中装备 refiner,如下图所示:
3、进入“文生图”或者“图生图”,在页面顶部能够看到多了两个选项:
Refiner checkpoint :挑选SDXL的精修模型。
Refiner switch at:从采样过程的第几步开始运用精修模型,这是个百分比。比方采样步数是30,这儿挑选0.8,那就是从 30*0.8=24 开始运用精修模型,在这之前的采样运用根底模型。
能够看到这个计划方便了不少,后续假如我测试没问题了,会将镜像升级到这个新版别。
本地布置体会
我这儿没有适宜的机器环境,所以没有实践布置,咱们能够看这个项目:
github.com/vladmandic/…
它是从 AUTOMATIC1111/stable-diffusion-webui Fork 过来的,可是针对各种渠道做了优化。
具体装置过程能够参考这篇文章:stable-diffusion-art.com/sdxl-model/…
其它体会办法
Google Colab
这是 Github 上开源的一个 Stable Diffusion XL 1.0 的演示项目,能够在Google Colab上免费运转。假如仅仅想简略的体会下,访问外网也没有问题,能够试试。
咱们翻开我同享的这个链接就能够运转。
colab.research.google.com/drive/1bBD9…
这儿没有启用 Refiner,由于会耗费很多内存,免费标准根本跑不起来。
当呈现下面这段文字的时分,就阐明启动成功了。
点击上图中的这个 public URL,就能够在浏览器中操作了。
不过在运用免费标准时,出过一张图之后,再出图时会呈现程序退出的问题,目测也是显存和内存不足导致的,XL需求的资源比较多。
此刻能够重启程序,然后再跑下一张,不过也是挺费事的。
Kaggle
除了白嫖 Google Colab,咱们还能够免费运用 Kaggle,Kaggle 比 Colab 好的是能够运用两个T4,必定程度上能够缓解内存不足的问题。Kaggle 每周能够免费运用30小时,不用的时分停机,停机不会计时。
具体运用办法不说了,网上已经有很多人介绍。
还是上边的 XL Demo 项目,我在Kaggle上也做了一个同享,咱们翻开下边这个链接:
www.kaggle.com/bosimabosim…
按照下边的过程操作即可。
留意这儿添加了一个参数:MULTI_GPU=true ,意思就是要运用多个CPU。实测的确能够下降体系内存的压力,连续生成多张图片也没有呈现体系溃散的问题,由于显存够用了就不会去占用体系内存,就不会由于内存无法分配而溃散。
不过启用 Refiner 还是会导致无法分配的问题,这儿 T4 GPU 的内存是 15G,两个就是30G,假如要想流畅的运转SD XL,需求更多内存或显存,这是免费标准提供不了的。
以上就是本文的主要内容了,如有问题欢迎沟通交流。