什么是AIGC?

最近,又火了一个词“**AIGC”**2022年被称为是AIGC元年。那么咱们敬请期待,AIGC为咱们迎候人工智能的下一个年代。

TIPS:内容来自百度百科、知乎、腾讯、《AIGC白皮书》等网页

@TOC

1.什么是AIGC?

AIGC 即 AI Generated Content,运用人工智能技能来生成内容,它被认为是继PGC、UGC之后的新式内容创造方式。AI绘画、AI写作等都属于AIGC的分支。2022年AIGC高速展开,这其间深度学习模型不断完善、开源形式的推进、大模型探索商业化的或许,成为AIGC展开的“加快度”。

AIGC现已代表了AI技能展开的新趋势。曩昔传统的人工智智能倾向于剖析才能,即经过剖析一组数据,发现其间的规矩和形式并用于其他多种剖析现已存在的东西,完结了人工智能从感知了解国际到生成发明国际的跃迁。

因而,从这个含义上来看,广义的AIGC可以看作是像人类相同具有生成发明才能的AI技能,即生成式AI,它可以依据练习数据和生成算法模型,自主生成发明新的文本、图画、音乐、视频、3D交互内容(如虚拟化身、虚拟物品、虚拟环境)等各种形式的内容和数据,以及包含敞开科学新发现、发明新的价值和含义等。

因而,AIGC现已加快成为了AI 范畴的新疆域,推进人工智能迎来下一个年代。Gartner将生成性AI列为2022年5大影响力技能之一。MIT科技谈论也将AI组成数据列为2022年十大突破性技能之一,乃至将生成性Al(GenerativeAl)称为是AI 范畴曩昔十年最具远景的展开。未来,兼具大模型和多模态模型的AIGC 模型有望成为新的技能渠道。

互联网新时代要来了(二)什么是AIGC?
2023年1月10日,百度Create AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏表明:AI从了解内容,走向了主动生成内容,包含AIGC用于作画、图文、视频等多类型的内容创造。

央视网人工智能修改部是中心广播电视总台旗下的才智立异基地,布局“云、数、智”构建全媒体产品服务和传达生态体系,充沛发挥“内容为王+渠道致胜+技能领先”的中心竞争力推进媒体深度交融、助力各范畴数据化转型、加快工业智能化升级。

互联网新时代要来了(二)什么是AIGC?

2022 年12月,OpenAI 的大型言语生成模型ChatGPT刷爆网络,它能担任刷高情商对话、生成代码、构思剧本和小说等多个场景,将人机对话推向新的高度,让网友们不禁置疑ChatGPT是否现已具有人类智能。 全球各大科技企业都在活跃拥抱AIGC,不断推出相关的技能、渠道和运用。

互联网新时代要来了(二)什么是AIGC?

2.AIGC展开趋势

2.1 AI技能的交融展开,催生了AIGC的迸发

互联网新时代要来了(二)什么是AIGC?
一是,根底的生成算法模型不断突破立异。 2014年,伊恩.古德费洛(lanGoodfellow)提出的生成对立网络(Generative Adversarial Network,GAN)成为前期最为闻名的生成模型。GAN 运用协作的零和博弈结构来学习,被广泛用于生成图画、视频、语音和三维物体模型等。GAN 也发生了许多盛行的架构或变种,如 DCGAN,StyleGAN,BigGAN,StackGAN,Pix2pix,Age-cGAN,CycleGAN、对立自编码器(AdversarialAutoencoders,AAE)、对立推断学习(Adversarially Learned Inference,AL)等。

随后,Transformer、依据流的生成模型(Flow-based models)、分散模型(Diffusion Model)等深度学习的生成算法相继涌现。 其间,Transformer 模型是一种采用自注意力机制的深度学习模型,这一机制可以依照输入数据各部分重要性的不同而分配不同的权重,可以用在自然言语处理(NLP)、核算机视觉(CV)范畴运用。

后来出现的 BERT、GPT-3、LaMDA等预练习模型都是依据Transformer 模型建立的。而分散模型(Diffusion Model)是受非平衡热力学的启示,界说一个分散进程的马尔可夫链,逐渐向数据添加随机噪声,然后学习逆分散进程,从噪声中构建所需的数据样本。

分散模型最初设计用于去除图画中的噪声。跟着降噪体系的练习时间越来越长而且越来越好,它们最终可以从纯噪声作为仅有输入生成逼真的图片。

互联网新时代要来了(二)什么是AIGC?

二是,预练习模型引发了AIGC技能才能的突变。尽管曩昔各类生成模型层出不穷,但是运用门槛高、练习本钱高、内容生成简单和质量偏低,远远不能满意实在内容消费场景中的灵活多变、高精度、高质量等需求。预练习模型的出现引发了AIGC技能才能的突变,以上的诸多落地问题得到了处理。

三是,多模态技能推进了AIGC的内容多样性,让AIGC具有了更通用的才能。预练习模型更具通用性,成为多才多艺、多面手的Al模型,首要得益于多模型技能(multimodal technology)的运用,即多模态表明图画、声响、言语等交融的机器学习

2021年,OpenAI团队将跨模态深度学习模型CLIP(Contrastive Language-Image Pre-Training,以下简称“CLIP”)进行开源。CLIP模型可以将文字和图画进行相关,比如将文字“狗”和狗的图画进行相关,而且相关的特征非常丰厚。

因而,CLIP 模型具有两个优势:一方面一起进行自然言语了解和核算机视觉剖析,完结图画和文本匹配。 另一方面为了有足够多标记好的“文本-图画”进行练习,CLIP模型广泛运用互联网上的图片,这些图片一般都带有各种文本描绘,成为CLIP天然的练习样本。据核算,CLIP模型搜集了网络上超越40亿个“文本-图画”练习数据,这为后续AIGC尤其是输入文本生成图画/视频运用的落地奠定了根底。

2.2 AIGC工业生态加快构成和展开,走向模型即服务(MaaS)的未来

现在,AIGC工业生态体系的雏形现已成型,出现为上中下三层结构。

互联网新时代要来了(二)什么是AIGC?

第一层,为上游根底层,也就是由预练习模型为根底搭建的AIGC技能根底设施层。因为预练习模型的高本钱和技能投入,因而具有较高的进入门槛。以2020年推出的GPT-3模型为例,Alchemy API 创始人EIliotTurner 推测练习 GPT-3 的本钱或许接近1200万美元。因而,现在进入预练习模型的首要机构为头部科技企业、科研机构等。

第二层,为中间层,即笔直化、场景化、个性化的模型和运用东西。预练习的大模型是根底设直范畴、功用场景的工业流水线式部署,一起兼具按需运用、高效经济的优势。跟着兼具大模型和多模态模型的AlGC模型加快成为新的技能渠道,模型即服务(Model-as-a-Service,MaaS)开端成为现实,估计将对商业范畴发生巨大影响。Stable Diffusion开源之后,有许多依据开源模型的二次开发,练习特定风格的笔直范畴模型开端盛行,比如闻名的二次元画风生成的Novel-AI,还有各种风格的人物生成器等。

第三层,为运用层,即面向C端用户的文字、图片、音视频等内容生成服务。在运用层,偏重满意用户的需求,将AlGC模型和用户的需求无缝衔接起来完结工业落地。以Stable Diffusion开源为例,它敞开的不仅仅是程序,还有其现已练习好的模型,后继创业者能更好的凭借这一开源东西,以C端消费级显卡的算力门槛,发掘出更丰厚的内容生态,为AIGC在更广泛的C端用户中的普及起到至关重要的效果。现在贴近C端用户的东西越发丰厚多样,包含网页、本地装置的程序、移动端小程序、群聊机器人等,乃至还有运用AIGC东西定制代出图的内容消费服务。

未来商场:

跟着标注数据累积、技能架构完善、内容职业对丰厚度/事实性/个性化的要求越来越高,AIGC职业即将被推向前台。

在未来2-3年间,AIGC的草创公司和商业落地案例将持续添加。现在由人工智能生成的数据占一切数据的1%不到,依据Gartner预测,到2025年,人工智能生成数据占比将达到10%。依据《Generative AI:A Creative New World》的剖析,AIGC有潜力发生数万亿美元的经济价值。

我国的AIGC职业没有展开成型,现在,AIGC代表公司较少,且上游还有众多短缺。

国内的AIGC场景开发较少:在我国,因为技能展开缺乏以及投资环境的影响,AIGC大多被作为公司的部分业务、乃至相对边缘化的功用进行研发开发,独立运行的草创公司数量明显少于国外,大部分细分赛道的草创玩家在5家以下,这也间接导致了国内的AIGC场景开发较少。

AIGC运用场景深度缺乏:国内布局最多的赛道是写作和语音组成范畴,虚拟人赛道刚刚开端鼓起根本均停留在内容范畴。而在国外延展范畴得到了更为充沛的发掘,例如个性化文本生成、组成数据等赛道均是要点布局范畴。此类业务拓宽的归纳性要求较高,需求客户方的数字化程度以及对对应职业的充沛了解。

AIGC 将是 Web3 年代的出产力东西。

3.AIGC技能

AIGC 技能首要涉及两个方面:自然言语处理 NLP 和 AIGC 生成算法。

3.1自然言语处理技能 NLP

自然言语处理是完结人与核算机之间怎么经过自然言语进行交互的手法。交融了言语学、核算机学、数学,使得核算机可以了解自然言语,提取信息并主动翻译、剖析和处理。

自然言语处理技能可以分为两个中心使命: 自然言语了解NLU:期望核算机可以和人相同,具有正常人的言语了解才能。曩昔, 核算机只能处理结构化的数据,NLU使得核算机可以辨认和提取言语中的目的来实 现关于自然言语的了解。因为自然言语的多样性、歧义性、常识依赖性和上下文, 核算机在了解上有许多难点,所以NLU至今还远不如人类的表现。 自然言语了解跟整个人工智能的展开历史相似,一共阅历了3次迭代:依据规矩的 办法、依据核算的办法和依据深度学习的办法。

互联网新时代要来了(二)什么是AIGC?
自然言语生成NLG:将非言语格局的数据转换成人类可以了解的言语格局,如文章、 报告等。NLG的展开阅历了三个阶段,从前期的简单的数据合并到模板驱动形式再 到现在的高档NLG,使得核算机可以像人类相同了解目的,考虑上下文,并将成果 出现在用户可以轻松阅读和了解的叙述中。自然言语生成可以分为以下六个进程:

内容确认、文本结构、句子聚合、语法化、参考表达式生成和言语完结。

互联网新时代要来了(二)什么是AIGC?

NLP首要被运用在四个方面:

情感剖析:互联网上存在许多的信息,表达的内容都是多种多样的,但抒情的感情 大致可以分为正面和负面的,可以被用来快速了解用户的舆情情况。

谈天机器人:近年来,智能家居的展开和普及使得谈天机器人的价值扩大。

语音辨认:微信中可以经过语音进行输入或直接将语音转化为文字,轿车导航可以 直接说目的地,大大提高了便利性。

机器翻译:机器翻译的准确率在近年大幅进步,youtube 和 netflix乃至可以做到视 频机器翻译.

商业上,NLP首要被运用在一下范畴:

用于处理财政、医疗保健、零售、政府和其他部门手写或机器建立档案文字处理工作,如:称号实体辨识(NER)、分类、摘要和相关撷取。这能将撷取、辨认和剖析文档资讯的流程主动化。 语意搜寻和资讯撷取和常识图表建立跨零售、财政、旅行和其他工业客户的交互AI体系等。

神经网络,尤其是循环神经网络(RNN)是当前 NLP 的首要办法的中心。其间,2017 年由Google 开发的 Transformer 模型现已逐渐取代长短期回忆(LSTM)等 RNN 模型成为了NLP 问题的首选模型。Transformer 的并行化优势允许其在更大的数据集上进行练习。这也促成了 BERT、GPT 等预练习模型的展开。这些体系运用了维基百科、Common Crawl等大型语料库进行练习,并可以针对特定使命进行微调。

Transformer 模型是一种采用自注意力机制的深度学习模型,这一机制可以按输入数据各部分重要性的不同而分配不同的权重。除了 NLP 以外,也被用于核算机视觉范畴。与循环神经网络(RNN)相同,Transformer 模型旨在处理自然言语等次序输入数据,可运用于翻译、文本摘要等使命。而与 RNN 不同的是,Transformer 模型可以一次性处理一切输入数据。注意力机制可以为输入序列中的恣意位置供给上下文。如果输入数据是自然言语,则 Transformer 不必像 RNN 相同一次只处理一个单词,这种架构允许更多的并行核算,并以此减少练习时间。

互联网新时代要来了(二)什么是AIGC?

3.2 AIGC生成模型

近年来,AIGC 的快速展开归功于生成算法范畴的技能积累,其间包含了:生成对立网络(GAN)、变微分主动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、能量模型和分散模型(Diffusion Model)。可以看到,大模型、大数据、大算力是未来的展开趋势。

生成对立网络 GAN(Generative Adversarial Networks)

2014 年,Ian J.Goodfellow 提出了 GAN,是一种深度神经网络架构,由一个生成网络和一个判别网络组成。生成网络发生“假”数据,并企图欺骗判别网络;判别网络对生成数据进行真伪辨别,企图正确辨认一切“假”数据。在练习迭代的进程中,两个网络持续地进化和对立,直到达到平衡状况,判别网络无法再辨认“假”数据,练习结束。

分散模型 Diffusion Model

分散模型是一种新式的生成模型,可生成各种高分辨率图画。在 OpenAI,Nvidia和 Google 设法练习大模型之后,它们现已引起了许多重视。依据分散模型的示例架构包含 GLIDE,DALLE-2,Imagen 和完全开源的安稳分散。分散模型现已具有了成为下一代图画生成模型的代表的潜力。以 DALL-E 为例,可以直接经过文本描绘生成图画,让核算机也具有了人的发明力。

除了上述说到的自然言语处理技能和 AIGC 生成算法模型以外,超级核算机和算力这些硬件作为根底设施也是不行或缺的。在机器学习的进程中,需求经过许多的练习来完结更准确的成果,这样的核算量一般的电脑是无法完结的,现在首要由英伟达 A100 构建的核算集群完结,而国内外的草创企业也会经过云完结。

4.AIGC有哪些运用价值?

AIGC将有望成为数字内容立异展开的新引擎。

1)AIGC可以以优于人类的制造才能和常识水平承担信息发掘、素材调用、复刻修改等根底性机械劳动,从技能层面完结以低边际本钱、高功率的方式满意海量个性化需求。

2)AIGC可以经过支撑数字内容与其他工业的多维互动、交融浸透然后孕育新业态新形式。

3)助力“元宇宙”展开。经过AIGC加快复刻物理国际、进行无限内容创造,然后完结自发有机生长。

互联网新时代要来了(二)什么是AIGC?

运用场景:

1)AIGC+传媒:写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能组成主播。

2)AIGC+电商:商品3D模型、虚拟主播、虚拟货场。

3)AIGC+影视:AI剧本创造、AI组成人脸和声响、AI创造人物和场景、AI主动生成影视预告片。

4)AIGC+娱乐:AI换脸运用(如FaceAPP、ZAO)、AI作曲(如初音未来虚拟歌姬)、AI组成音视频动画。

5)AIGC+教育:AI组成虚拟教师、AI依据讲义制造历史人物形象、AI将2D讲义转换为3D。

6)AIGC+金融:经过AIGC完结金融资讯、产品介绍视频内容的主动化出产,经过AIGC刻画虚拟数字人客服。

7)AIGC+医疗;AIGC为失声者组成言语音频、为残疾人组成肢体投影、为心理疾病患者组成医护陪伴。

8)AIGC+工业:经过AIGC完结工程设计中重复的低层次使命,经过AIGC生成衍生设计,为工程师供给灵感。

5.AIGC给咱们带来的改变

1)澜舟科技开发的孟子模型已在营销案牍生成、文学辅助创造、研报生成、论文助写、数字人脸生成、新闻报道编撰、智能客服等范畴落地。 运用孟子模型,仅需几秒就能生成一篇营销案牍,本钱约2元,而完全由人工编撰约需60元。周明说,孟子模型所学常识远超个别,“写出”的案牍在多样性和新颖性方面更具优势。“整体来看,运用AI辅助创造,进步内容出产功率、降低本钱,已是大势所趋。”

2)自然言语处理、语音辨认、核算机视觉等使命的性能均明显提高。这些技能的革新使AI越来越“聪明”和“善解人意”,经过许多练习,在许多专业范畴可表现出超越人类的创造才能,一起还能与人类顺畅沟通。

标准化、制式化的创造和职业将被更多替代,而具有独立思考、具有丰厚创意的内容及工作,重要性将更加凸显。

3)AIGC运用将提高出产功率,加快内容出产和产品研发进程;改变信息获取来历,优化用户查找体会;也会降低互联网内容的出产门槛。

AIGC有助于拓宽艺术创造的想象力。创造者受自身习惯、风格与偏好影响,其想象力易拘泥于某一子空间;而人工智能没有桎梏与束缚,能更好地激起艺术发明力。

互联网新时代要来了(二)什么是AIGC?

6.AIGC面对的应战

AIGC在引发全球重视的一起,常识产权、技能道德将面对诸多应战和危险。一起AIGC间隔通用人工智能还有较大的间隔。

1)常识产权争议。AIGC的飞速展开和商业化运用,除了对创造者造成冲击外,也对许多依托版权为首要营收的企业带来冲击。

2)关键技能难点。AIGC间隔通用人工智能还有较大间隔,当前热门的AIGC体系尽管可以快速生成图画,但是这些体系未必可以真实了解绘画的含义,然后可以依据这些含义进行推理并决议计划。

3)创造道德问题。部分开源的AIGC项目对生成的图画监管程度较低,数据集体系运用私家用户相片进行AI练习,侵权人像图片进行练习的现象屡禁不止。一些用户运用AIGC生成虚伪名人相片等违禁图片,乃至会制造出暴力和性有关的画作。因为AI自身尚不具有价值判断才能,一些渠道现已开端进行道德方面的约束和干预,但相关法律法规仍处于真空阶段。

4)环境应战。依据预练习模型的AIGC不仅是练习还是运行,都需求许多算力支撑,无形中添加了能源消耗,其高速展开给环境保护和气候变化带来了巨大应战,发生高碳排放。

5)安全应战。安全问题始终是AI技能展开和运用中不行逃避的。同样的,在AIGC方面也存在内容安全、技能滥用、用户隐私和身份、AI内生安全等多个方面的安全应战。

一是内容自身。一直以来,互联网信息空间都面对着虚伪信息和信息内容安全的应战,国内外互联网内容渠道,如Facebook、Twitter、微信、微博等都不断在提高其虚伪内容和信息安全的治理才能。但跟着AIGC内容的持续增长,虚伪信息和信息内容安全的应战也会添加。

二是,对AIGC的歹意运用或滥用,引发的深度组成欺诈、色情、诽谤、假冒身份等新式违法犯罪行为。不法分子运用开源的AIGC模型或东西,可以以更低的门槛、更高的功率来制造出音视频、图片和文字等品种丰厚的、真伪辨别难度大的虚伪信息,一起也更容易地盗用用户身份,以此展开新式欺诈等非法活动。 三是,用户隐私和身份安全。AIGC模型练习的数据中根本上来历于互联网,其间或许包含个人隐私数据,而且预练习模型强壮的推理才能或许会导致个人隐私数据走漏的危险。此前,如下图所示GPT-2就发生过隐私走漏的问题,可见个人隐私数据是被收录在模型的练习数据集之中。

互联网新时代要来了(二)什么是AIGC?

四是,AIGC的内生安全应战。在MaaS的工业运用形式下,生成模型的内生安全问题,如遭受后门进犯、数据中毒等,以及怎么将被进犯模型中的有毒数据去除。与此一起,用户数据通常以明文形式提交给模型服务供给商,怎么运用现有的加密技能保护用户数据隐私也是一个重要的安全应战。

社会各界需求携手应对AIGC范畴的相关问题和应战,致力于打造绿色可持续、环境友好型的AI模型,完结智能化与低碳化交融展开。

“未来已来,让咱们拥抱AIGC,拥抱人工智能的下一个年代,打造更夸姣的未来。”

本文正在参与技能视角深化 ChatGPT 征文活动