起猛了,OpenAI 居然把 AI 绘画和 ChatGPT 合 并 了!
这不,最新发布的 DALLE 3,直接给 AIGC 带来了两大震撼——
-
提示词门槛极大降低
-
了解语意的纤细差异的细节描绘,精确到令人发指
没错,新版 DALLE 3,不仅省去了提示词工程,还顺带把语言了解才能提升了一个层次!
你只管随意想象。词,ChatGPT 帮你拓宽;画,DALLE 3 给你精确到细节。
AI 就能像拍电影一般,保证从布景到人物,细节一字不差地复刻出来:
满月下的大街,熙熙攘攘的行人正在享用富贵夜生活。
街角摊位上,一位有着火红头发、穿着标志性天鹅绒斗篷的年青女子,正在和脾气暴躁的老小贩讨价还价。
这个脾气暴躁的小贩身材高大,老道,身着一套整齐西装,藏着引人注目的小胡子,正在用他那部蒸汽朋克式的电话兴味盎然地交谈。
除了根底细节,DALLE 3 乃至能将含糊的形容词如富贵、讨价还价、脾气暴躁演绎得活灵活现,和 CLIP 现已不在一个层次了。
一起,相比上一代老模型,DALLE 3 自身的画技也前进了一大步:
这般操作,直接把网友看愣了。
有网友现已决议撤销 Midjourney 订阅了。“假如 Midjourney 无法精确了解文本,这乃至称不上是同台竞技。”
还有网友戏弄,这简直便是给即将到来的谷歌 Gemini 上压力。
更多细节,咱们从 DALLE 3 展现的作用一一来看。
在 ChatGPT 里直接用
相比前两代,DALLE 3 最大的优势在于原生构建在 ChatGPT 之上。
不仅意味着语言了解才能大幅飞跃,乃至提示词都能够让 ChatGPT 自己来写。
更多细节藏在奥特曼都不由得自夸心爱的宣传视频里。
这是一个家长把 5 岁小朋友脑海里的梦想变成现实的故事。
首要家长问询 ChatGPT,“我家 5 岁宝宝一向在说一个’超级向日葵刺猬’,它该长什么样?”
能够看到 ChatGPT 一起写了四段不同风格的提示词,并给出对应图画。
家长挑选其间偏神话插图风格的一张后,故事的主角小刺猬形象似乎就能固定下来了,能够继续请 ChatGPT 画出更多。
顺便给小刺猬一个名字 Larry,后边的对话中就不必每次都说 “超级向日葵刺猬” 了。
主角定好了,接下来再添加更多元素,让整个神话故事更丰富,比方给 Larry 画个房子。
这儿既展现出了 DALLE 3 创造共同形象的才能,也展现出邮箱上正确写上了 LARRY 的名字,处理了之前版本 DALLE 不会写字的问题。
横竖都用上 ChatGPT 了,不如把故事情节也完善一下?
刚编好的情节立马就能够有配套的插画了。
保持人物形象,迁移到彻底不同的贴纸画风也没问题,能够直接打印出来。
注意了,最绝的地方来了,直接让 ChatGPT 总结前面对话中所有内容,写成一个完整的睡前故事。
虽然演示到此结束,但彻底能够想象协作 ChatGPT 插件功用,还能够直接生成一本电子书出来。
就让人想起之前网友提议,保证 AI 安全的最佳方法是让 OpenAI、Anthropic 等公司的职工都有孩子。
这样他们就有动力保证 AGI 到来时世界是安全的。(手动狗头)
虽然 DALLE 3 现在还不能马上玩到,一次放出的很多样张也能够先看个饱了。
每一张点开还能够看到提示词,都是直接用人话描绘,没怎么加复杂咒语的那种。
复杂场景与不存在的概念组合,作用很惊艳。
搞室内设计概念图,光影明暗关系乍看也挑不出毛病。
协作正确写字才能,直出海报也是生产力拉满(没指定文字的小字部分还有些问题)。
刚加入 OpenAI 不久的德扑 AI 之父 Noam Brown 也晒出了他试玩的机器人打牌图。
CEO 奥特曼最喜欢的则是这张 “牛油果看医生”。
有网友去试了同样的提示词用在 DALLE 2 的作用,只能说字也不对、牛油果中心的洞没话出来,医治是更是没有……
还记得 2021 年 1 月 DALLE 1 刚出的时候吗?梦开始的地方便是一组 “牛油果做的沙发”。
也难怪网友感叹:看看它走了多远!
“如有侵权,请来删图”
当然,除了上述特性以外,OpenAI 也预告了一些奇特的新功用。
例如,DALLE 3 即将配套推出一个图画鉴别器。
这个分类器能够协助辨认图画是否由 DALLE 3 生成,不仅能避免误伤(手动狗头),也能在 DALLE 创造出好作品时快速将它认领成自己的。
至于在生成图画上,OpenAI 自述也做了很多工作,避免其生成暴力、色情或其他有害图片,或是带有大众人物(明星、名人等)名字的图画生成。
关于隐私方面,之前纽约时报就曾爆料称,OpenAI 正在经过某些技能,含糊掉上传到 ChatGPT 的图画中的人脸。
这也是为了避免 ChatGPT 变成一个彻底的 “人脸辨认东西”,尤其是现已有不少照片流传到互联网上的名人明星们。
如今这个技能可能也被用到了 DALLE 3 中,避免生成侵权图画。
一起,OpenAI 也与安全红队协作,提高了图画风险评估的才能。
除此之外,在练习数据上,有了 Midjourney 的 “前车之鉴”,OpenAI 这次也学会了保护自己。
相比于直接和画手打官司、或者等着被起诉,OpenAI 在官网放出了一则练习数据 “免责声明”:
您能够填写表格,制止咱们的网络爬虫 GPTBot 拜访您的网站。或者,您也能够发送您想要保护隐私的图画,咱们会把它从练习数据中删掉。
不过也有网友对 DALLE 3 演示作用不满意,认为比不上 MidJourney 资深玩家出的图,OpenAI 的资金但是充裕 n 多倍啊。
还有网友敞开列文虎克形式,开始挨个挑演示图中漏掉的提示词细节。
比方这张杯子里短少微型闪电。
这张散落在海底的只有大炮残骸,没有宝藏。
详细这些问题能不能经过调整提示词改善,就要等实际上手玩过才知道了。
那么 DALLE 3 详细什么时候上线呢?划重点了:
-
ChatGPT Pro 会员(20 美元 / 月)和企业版在 10 月可用。
-
独立版在本年秋天晚些时候供给(目前价格 15 美元能够玩 115 次)。
参考链接:
[1]openai.com/dall-e-3
[2]www.nytimes.com/2023/07/18/…
[3]twitter.com/sama/status…
— 完 —