AIGC运用
AI“摄影”
【商用部分收费】docs.midjourney.com/docs/plans
【网友的midjurney杰作,虚“假”难辨】
A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen —v 5 —s 250 —q 2.
AI规划
【beta版别不能商用】firefly.adobe.com/faq
【Adobe发布AI东西:Adobe Firefly】
AI动画/视频
【商用部分收费】runwayml.com/pricing/
AI阅读理解
【开源】【国内清华团队】github.com/THUDM/ChatG…
【只要扔进去一段网址,AI主动帮你”省流””】
AIGC多模态——数字人
【商用部分收费】www.d-id.com/pricing/
“AIGC出圈”的考虑
2023最出圈产品 | midjurney和chatGPT |
---|---|
midjurney | prompt辅导具象化艺术发明,拓宽了智能发明的幻想空间,提高功率、主动化出产。 |
chatGPT | 量变引起突变,大模型的通识体现,拓宽了智能交互的幻想空间,简化流程、降低获取信息本钱。 |
AIGC为什么火?
-
关键词:【幻想】【功率】【主动化】
- 幻想空间:曾经很多人以为AI无法完成艺术发明,以chat bot为代表的强人工智能的体现也一直被人诟病,调侃为”人工智障”,直到2022年末,两款运用横空出世…
- 功率:学会与AI交流,为许多互联网er置换出很多的时空资源,让他们有精力聚焦在更有价值发明的地方。
- 主动化:人类的前史无非便是“汽车替代马车夫,机器替代手艺”的进程,在这个信息爆破的时代,技能的本质其实是东西,它的最大价值,便是降低了出产力的本钱。从刀耕火种,再到青铜时代再到工业时代,人类文明前进的一个主线便是单位出产力的本钱更低了。
-
AIGC的未来:
-
依赖prompt:
- 尽管有了海量数据的投喂,大模型的泛化才能已经很强,但无论是midjurney仍是GPT,想要得到一个好的答案或者作用,仍然需求一个精准的问题描绘。而一个明晰准确的好问题,需求良好的逻辑,准确的语言,以及厚实的常识面对AI给到的成果进行验证和反应。这恰恰是最难的,很多人实际上并不具有提出一个好问题的才能。
-
“智能发明”的止境:也许是AI短视频、AI制片、AI动画
-
“智能交互”的止境:也许是端交互、可视化交互、沉溺式交互、多模态交互
-
考虑一:供给幻想力价值
假如未来一切的劳务都被AI替代,人类仅有还能出产的便是幻想力,科技是榜首出产力,幻想力是推进出产的源动力。
当下的人们该怎么去认知人工智能?人工智能的开展还要解决哪些问题?未来人工智能究竟会走向何方?会不会推翻人类自己?咱们人类究竟该怎样去开展人工智能?关于群众而言,这些问题似乎很难有答案。
爱因斯坦说,“常识是有限的,而幻想力却能漫游国际。” 幻想力是打开科技前进之门的榜首把钥匙。
考虑二:养“懒”客户
AI的优势是协助客户快速、降本、主动化解决问题。“培育”客户慵懒,供给高品质体会,顺着人道、抚摸人道、引导人道。
数字营销 | 互动娱乐 | 发明共享 | |
---|---|---|---|
替代用户完成他们需求做但做不到、不想做的事 | AI运营 | 24h客服、24h直播、24h陪聊 | 无间断更新 |
协助用户完成他们需求做但比较难或投入过多的事 | AI带货、AI写文案 | AI讲师、AI主持、AI说明 | AI辅佐工作、AI绘图、AI规划、AI编排 |
引导用户做他们喜爱做却又没做过的事 | AI模特、AI制片 | 智能NPC | AI制片、AI动画、AI摘要视频、AI演绎小说 |
考虑三:ToB or ToC
ToB是“stable”的,ToC是“flow”的。
AIGC,说到底,终极矛盾依然是toC。toC商场对用户的喜爱是敏感的,技能的演进和迭代,需求用户继续不断的输入和反应,才能构成出产闭环。数字人的开展未来最好的一种形式:通过对司内业务的支持,直接捕捉C端商场的爱好变化以注入业务生机,一起推进商业形式和技能创新,再反哺到ToB才能上,这样的正循环更有利于培育业务壁垒,构成的商业才能护城河。
AI作图
“AI作图”主流运用
聊聊开源模型SD
- Stable diffusion:
大模型,SD的推理其实便是通过文本编码来辅导图画去噪的进程,输入的prompt在embedding后能够在潜空间寻找与目标描绘最类似的图画分布特征。【Git】github.com/CompVis/sta… 【Course】www.bilibili.com/read/cv2156… |
---|
- +stable diffusion WebUI
一款功用反常强大的AI图片生成器。 它不仅支持生成图片,运用各种各样的模型来达到你想要的作用,还能练习自己的专属模型。 Stable Diffusion WebUI使得Stable Diffusion有了一个更直观的用户界面,更适合新手用户。 |
---|
- +Lora
小模型,通过设置权重能够叠加对根底大模型的作用影响。 | 调整画风: | 换脸、换装: |
---|
- +ControlNet
一款强大的精准控图插件:能够主动识别图画canny、depth、hed、openpose等多种融合特征,辅佐文本描绘词,完成用户想要的任何作用。 |
---|
-
常用模型:
-
文生图/图生图 NovelAI Stable diffusion v1.5 Chilloutmix CharTurnerBeta 日系二次元模型 现实通用模型(景色作用好) 写实写真模型(人物作用好) 三视图模型
-
-
常用东西:
-
下载模型:
模型网站 Prompt tag网站 (H站) huggingface.co/facebook tag.muhou.net/ (C站)civitai.com/ aitag.top/ tags.novelai.dev/ www.wujieai.com/tag-generat…
-
-
实践:
-
根底大模型(sd):人物/景象/景色/构图/质感/画风
-
小模型(lora): 角色/什物/风格/画风
-
人物学习(>=10张) SD根底模型 + lora风格模型
-
画风学习(>=50张) lora模型 / hypernetwork
-
AIGC的版权危险
- “AI作图”面临的侵权危险
版权问题应该是“AIGC”领域最大的争议,公司的法务团队也在评估中…
当时国内外关于AIGC获取与运用版权著作进行算法练习是否合法存在诸多争议,AI绘画的版权问题尚在风口浪尖,尚无立法和司法层面的清晰一致;Stable Diffusion通过充分练习后,能够依据用户给出的文本输出最终图画。但这些生成的图画内容,很大的概率包含并展现出作为练习数据的版权著作的元素及特征。
谷歌公司的研究人员Kevin P. Murphy指出:机器学习模型有时会重建输入数据的特性,而不是反映这些数据的潜在趋势。此类模型能够视为生成著作的概率模型,落入原作“复制品”或“衍生著作”的广泛定义,存在侵略“复制权”与“改编权”的危险。
- 运用中需求注意什么
-
关于模型练习的危险预警和应对:
- 像chatGPT、SD这种大模型的练习依赖于海量的数据集,大模型练习尽可能避开有版权的数据集。
- 除了著作权的危险,一起也要防止运用带有商标、人物肖像或者特殊外观规划的未授权数据,否则有可能会构成对专利权、商标权、肖像权的侵权。
- 运用水墨画、二次元等较高艺术形式的数据版权危险更高,尽可能避开。
-
关于AIGC成果的侵权预警:
- 假如练习集自身已授权,则生成成果同样无危险。
- 假如练习集未授权或无版权,且类似度小于80%,则生成成果版权公开,不归于任何人。
- 假如练习集未授权,且生成成果和原图类似度大于80%,就归于侵权行为。