最初
最近刷短视频看到了许多关于AI绘图,Midjourney
,gittimg.ai
,Stable Diffusion
等一些绘图AI东西,感受到了AI绘画
的魅力。经过chatGPT
生成关键词再加上绘图东西,真是完美,文末教咱们怎么用gpt提词
Midjourney 算是体验最好的了,生成的图片也特别完美,运用也简单,它是在线网页,计算在云服务器上
新人有 25 次免费运用次数,不加入特定指令的情况下,是能生成四合一的图片的(算一次),单独挑出其中一张挑选U或V(U是扩大图片,U1\U2\U3\U4 分别指的是扩大四张图片中的某一张,V是选用图片的构图形式,从头生成),只需求在输入框输入“/imagine”就能够敞开AI智能图片之旅。输入指令 /info 能检查剩余分钟,订阅信息。Midjourney
gittimg.ai是一套神奇的 AI 东西,能够大规模生成原始图画、修改相片、将图片扩展到原始边界之外,或创立自定义 AI 模型
渠道供给了20多个基于Stable Diffusion的AI模型。特别友好的是,每个用户每月免费供给了100张图片生成。几秒钟就能生成一张图片,仍是很快的。getimg.ai
Stable Diffusion 开源免费,出图速度与电脑装备有关
和Midjourney功用差不多,能够文字转图片。电脑显卡越好出图越快。不过装置进程挺费劲的,花费了一天的时间才装置好,本篇文章将围绕Stable Diffusion从装置到运用的进程来介绍。项目地址
由AI画出来的人物,够实在吧
还有风景图,这个是用默许模型画的
AI绘图
什么是AI绘图
AI绘图是指派用人工智能(AI)技能生成或辅助创立图画和视觉内容的进程。AI绘图东西一般使用深度学习算法,如生成对立网络(GANs)、变分自编码器(VAEs)和其他神经网络架构,以生成新的图画、对现有图画进行风格搬迁、涂色,甚至依据文本描绘生成相应的图画。
-
艺术创作
:AI能够生成独特的艺术作品,模仿著名画家的风格,或许依据用户输入的指导进行创作。 -
规划
:AI辅助规划东西能够帮助规划师更快地创立图标、插图、海报等视觉元素。 -
动画与游戏
:AI能够主动生成游戏角色、场景和物品,减轻开发人员的负担,并提高创作功率。 -
影像处理
:AI能够用于主动进行图画修复、去噪、涂色等操作,提高处理质量和功率。 -
图画生成
:基于文本描绘生成图画的AI模型能够为广告、交际媒体和其他渠道供给定制的视觉内容。
Stable Diffusion
介绍
Stable Diffusion 是一个开源的东西,咱们能够用文字来描绘 并将文字发给它,它就能帮咱们生成对应的图片,一起它还支撑图生图功用,等等。
模型
运用这个东西需求运用模型,官方也供给了对应的图画模型,下载即可。一起还能够去C站下载小模型来制作不同范畴的图片
装备
这个东西对硬件要求不是特别高,所以在咱们个人电脑也能跑,不过生成的速度取决于电脑装备,显卡越好速度越快。由于该东西比较复杂,然后咱们需求凭借Stable Diffusion web ui
可视化东西来操作
装置
在线运用
在线运用需求凭借谷歌的服务:stable-diffusion-webui-colab。需登录谷歌账户,然后点击页面中的发动 即可直接运用。在线运用本期先不细讲
本地装置运用
这儿我运用的设备是笔记本电脑,window11,RTX20250,16g内存,12代因特尔处理器,生成一张图大概20秒
Stable Diffusion web ui
依赖于Python3.10.6,所以需求先下载装置Python
装置Python
Python下载地址www.python.org/downloads/w…
我这儿下载的是装置版本,装置时分记得勾选增加到PATH,这样省得自己增加环境变量了
下载Stable Diffusion web ui
假如你没有装置git,那么需求装置一下git
下载地址
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
装置依赖
直接运行项目目录下的webui-user.bat
文件,它将会主动装置一切的依赖,这儿最好翻开科学上网(git走的是终端的网络,上网东西需求开网卡形式),不然下载很慢还容易失利。
装置完依赖后会主动发动,由于首非必须安依赖所以很慢,下次发动就会很快了
终端出现127.0.0.1:7860字样就代表发动成功了,然后运用浏览器拜访即可,装置好默许是英文的
设置言语为中文
- 挑选
Extension
选项卡,点击Install from URL
子选项卡 - 仿制git库房地址
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
- 点击install按钮 进行装置。如图
- 然后重启webui,以保证插件载入成功。挑选
Settings
,点击Reload UI
重启 - 在
Extensions
选项卡,确认已勾选本扩展☑️;如未勾选,勾选后点击Apply and restart UI橙色按钮
启用本扩展
- 切换言语包(zh-CN)
- 在
Settings
选项卡中,找到User interface
子选项
-
然后去页面最底部,找到
Localization (requires restart)
小项,找到在下拉选单中选中zh_CN
(假如没有就按一下按钮),如图 -
然后按一下 页面顶部左边的橙色
Apply settings
按钮保存设置,再按 右边的橙色Reload UI
按钮重启webUI
到这儿就完成了设置中文,重启webui后就切换为中文界面了
下载模型
模型阐明
大模型
画图主要便是运用大模型的一些数据来生成图片,小模型lord
的功用便是对大模型的一些参数做一些微调
大模型
下载官方供给的大模型github.com/camenduru/s…
翻开页面后,滑动到下面。如图。我这儿下载的是1.5版本,稳定版
然后跳转页面,往下滑,找到Download,挑选4.27G的这个
假如你想要制作人物
,那么推荐下载这个模型,制作美人
就用这个模型chilloutmix
是日本的一位作者开发的AI人像模型,符合亚洲用户喜爱的美人人像,上面的美人便是本模型画出来的
然后将下载的大模型放到 指定的文件内\stable-diffusion-webui\models\Stable-diffusion
小模型Lora
咱们能够去C站找喜爱的小模型下载Civitai
找到你喜爱的图画,然后点击进去,挑选下载,一般小模型就几百M
小模型咱们放到 Lora文件夹\stable-diffusion-webui\models\Lora
以下是一些运用chilloutmix
模型画出来的的图
运用
Stable Diffusion web ui 功用许多,咱们主要用到如下两个功用
-
文生图
(text-img)便是经过描绘词来画图 -
图生图
(img-img)导入图片,然后在加上描绘词进行画一张新的图片
文生图
(怎么下载导入模型在前面的装置篇章有说)
如图,页面左上角这儿,挑选大模型,咱们能够切换想要的大模型。我挑选官方默许模型
输入一些正面提示词
green sapling rowing out of ground,mud,dirt,grass,high quality,photorealistic,sharp focus,depth of field
运用chilloutmix模型
首先去C站找到喜爱的模型图片,然后点击图片右下角叹号
小模型下载阐明在前面已经讲了。然后将提示信息,和对应的参数 在Stable diffusion web ui 上填写,然后就能够生成啦
发动参数
能够修改项目目录下的 webui.bat
文件,加入一行参数,如图
这儿加的参数意思分别为
-
--listen
启用局域网拜访,这样就能够在其他电脑拜访啦 -
--port 8888
设置端口号为8888 -
--use-cpu
设置运用cpu来处理,没显卡的电脑需求设置一下,由于默许是运用显卡GPU
假如想要经过api调用来生成图片,能够运用--api
参数,发动webui后,在url地址上加上/docs
就能看见api接口文档了。这样就能自己编写代码来调用文生图等等一些功用了接口具体文档
还有许多参数能够查阅官方文档
其它
默许运用的是GPU,假如没独显可能需求装备一下参数挑选运用cpu处理
关于提示词
负面提示词
通用负面提示词: (deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
正面提示词
使用chatGPT生成正面提示词的方法,将下面这段描绘发给GPT-4
即可
以下提示用于指导Al绘画模型创立图画。它们包含人物外观、布景、色彩和光影效果,以及图画的主题和风格等各种细节。这些提示的格式一般包含带权重的数字括号,用于指定某些细节的重要性或强调。例如,"(masterpiece:1.4)"表示作品的质量非常重要。以下是一些示例: 1.(8k, RAW photo, best quality, masterpiece:1.2),(realistic, photo-realistic:1.37), ultra-detailed, 1girl, cute, solo, beautiful detailed sky, detailed cafe, night, sitting, dating, (nose blush), (smile:1.1),(closed mouth), medium breasts, beautiful detailed eyes, (collared shirt:1.1), bowtie, pleated skirt, (short hair:1.2), floating hair, ((masterpiece)), ((best quality)), 2.(masterpiece, finely detailed beautiful eyes: 1.2), ultra-detailed, illustration, 1 girl, blue hair black hair, japanese clothes, cherry blossoms, tori, street full of cherry blossoms, detailed background, realistic, volumetric light, sunbeam, light rays, sky, cloud, 3.highres, highest quallity, illustration, cinematic light, ultra detailed, detailed face, (detailed eyes, best quality, hyper detailed, masterpiece, (detailed face), blue hairlwhite hair, purple eyes, highest details, luminous eyes, medium breats, black halo, white clothes, backlighting, (midriff:1.4), light rays, (high contrast), (colorful). 模仿之前的提示,写一段描绘如下要素的提示:车水马龙的城市