- 作者:韩信子@ShowMeAI
- 深度学习实战系列:www.showmeai.tech/tutorials/4…
- 自然语言处理实战系列:www.showmeai.tech/tutorials/4…
- 核算机视觉实战系列:www.showmeai.tech/tutorials/4…
- 本文地址:www.showmeai.tech/article-det…
- 声明:版权一切,转载请联系平台与作者并注明出处
- 保藏ShowMeAI检查更多精彩内容
随着 Diffusion Model 的遍及,我们可能留意到互联网上有着漫山遍野的人工智能 (AI) 生成的图画,这些图画都是运用『文本到图画』的生成模型生成的:只需求输入一个文本描述(prompt/提示),AI 模型就能够在几秒几分钟内生成一个或多个精准匹配提示的精巧图画。
ShowMeAI在前序的文章中也做了一些相关的介绍:
你给文字描述,AI艺术作画,精巧无比!附源码,快来试试!
运用Hugging Face发布的diffuser模型快速绘画
截止现在为止,三个最盛行的AI作画产品是 Stable Diffusion、Midjourney和 DALLE 2。
在本文中,ShowMeAI将对这3种模型进行比较,咱们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在运用方法和效果比照。
DALLE2
DALLE2由 OpenAI开发,现在产品版别处于 beta 阶段。
如何运用
① 文本提示作图
在 DALLE2 中,能够运用 『文本到图画』和『文本引导的图画到图画』生成算法生成图画。 运用『文本引导的图画到图画』生成算法,您能够上传图画,AI会以你上传的图画为初始图,依据提示来作图。
上图 DALLE 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个心爱的机器人站在森林里的定格动画)。
② 文本提示的图到图
它还有『编辑生成的图画』功能,运用『文本引导图画到图画』生成算法,咱们能够在已生成的图画之上生成另一个图画来扩展生成的图画,或者对有遮盖的图画进行补全创作。
③ 分辨率和格局
在 DALLE2 中,一切生成的图画都具有 1024 x 1024 的固定图画巨细 。
运用费用
初次访问 DALLE 能够获得 50 个免费积分(要求在第一个月内用完)。 在接下来的每个月中,都会获得 15 个免费积分(对,相同的道理,免费积分不会累加)。
每1个提示默许会创立4个图画,消耗大约1个积分,你也能够付费花 15 美元购买 115 次作图。
可否商用
对,咱们能够商用 DALLE2 生成的图画,官方的条款如下:
在恪守这些条款和咱们的内容方针, 您能够将生成的图画用于任何合法意图,包含商业用处 。 这意味着您能够将您的权利出售给您创立的图画,将它们应用到书本、网站和演示文稿等著作中,或者以其他方法将它们商业化。
Midjourney
Midjourney 由同名研讨实验室开发,现在处于公测阶段。
如何运用
生成图画 Midjourney ,您能够运用 Midjourney Discord 服务器。
① 文本提示作图
Midjourney的『文本提示做图』也十分简略,也相同是提交提示文本,就能够生成对应的结果。
上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个心爱的机器人站在森林里的定格动画) 的运转结果。
② 图画变体&高分辨率
此外,您能够创立生成图画的其他变体或将生成的图画放大到更高分辨率。
咱们也能够输入一个或多个图画的 URL,以其作为初始,配以提示文本引导作图。
③ 分辨率和格局
Midjourney支撑创立各种格局的图画,图画分辨率高达 2048 x 2048 。
运用费用
初次加入 Midjourney Discord 服务器,咱们能够获得 25 分钟的免费 GPU 时刻,大致能够支撑 25 次免费生成(1次生成大概需求1 GPU 分钟)。单次恳求将依据提示生成4个候选画作。
付费应用的费用如下:
- 根本方案每月花费 10 美元,200 分钟 GPU 时刻(每次图画生成大约 5 美分)
- 规范方案每月花费 30 美元,15 小时 GPU 时刻(每次图画生成大约 3 美分)
可否商用
Midjourney答应付费会员将 Midjourney 生成的图画用于商业用处,具体的条款如下:
依据上述答应, 您具有运用服务创立的一切财物 。 如果您归于以下例外情况,则不适用。 […]
如果您 不是付费会员,Midjourney 依据知识同享非商业性 4.0 署名国际答应(『财物答应』)授予您财物答应。
Stable Diffusion
Stable Diffusion 由 CompVis、 Stability AI和 LAION开源,于 2022 年 8 月发布,我们都能够运用(但需求一些服务器核算资源支撑)。
如何运用
如果要本地运转 Stable Diffusion,至少需求 10GB VRAM 的 GPU。 Huggingface 供给了有关如何运用 Stable Diffusion 教程。
如果您不想编写和触碰任何代码,也能够运用 Dream Studio Web 应用程序,只需求注册一个帐户即可。
① 文本提示做图
Dream Studio 供给 『文本到图画』,它具有各种选项,例如设置生成图画的过程数或设置随机种子,能够设置单次生成的图画数量(1 到 9 之间)。
上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个心爱的机器人站在森林里的定格动画) 的运转结果。
一个方便测验的方法是在 HuggingFace的 Diffuse the Rest应用里测验,如下图所示:
② 分辨率和格局
运用 Stable Diffusion,您能够创立各种格局的图画,图画分辨率高达 1024 x 1024。
运用费用
初次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免费生成的额度。 免费试用后,您能够按 10 英镑的增量购买额定的积分。
可否商用
能够在商业上运用 Stable Diffusion 生成的图画,相关的条款如下:
请留意,虽然用户现已丧失了这些图画的版权(以及任何/一切知识产权声明),但任何人都能够将其用于任何意图。 随意运用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图画用于任何用处, 包含商业意图 。
总结
在本文中,咱们比较了现在最盛行的3个图画生成平台 DALLE2、Midjourney、Stable Diffusion。比照的结果汇总如下表:
不过请我们留意,下表可能会发生变化,因为这三个模型正在积极开发中,功能也在不断完善。下方的信息来历时刻点为2022年9月。
参考资料
- 你给文字描述, AI 艺术作画,精巧无比!附源码,快来试试!:www.showmeai.tech/article-det…
- 运用Hugging Face发布的diffuser模型快速绘画:www.showmeai.tech/article-det…
- DALLE2:openai.com/dall-e-2/
- OpenAI:openai.com/
- Midjourney:www.midjourney.com/
- Midjourney Discord 服务器:discord.gg/midjourney
- Stable Diffusion:colab.research.google.com/github/hugg…
- CompVis:github.com/CompVis
- Stability AI:stability.ai/
- LAION:laion.ai/
- Dream Studio Web 应用程序:beta.dreamstudio.ai/
- Diffuse the Rest:huggingface.co/spaces/hugg…
本文正在参与「金石方案 . 瓜分6万现金大奖」