导言

1950 年,艾伦图灵提出闻名的「图灵测验」,给出断定机器是否具有智能的试验方法。16 年后,世界上第一款可人机对话的机器人“Eliza”面世,这是 AI 技能最前期的萌芽阶段。但由于其时的科技水平约束,AIGC 仅限于小范围实验。

从文本、图像到音视频,AIGC技术将如何重构我们的数字世界?

AIGC的技能开展

Eliza 的呈现代表了人们对人工智能和天然言语处理的探究和爱好,一同也反映了人们对计算机能否模拟人类思维和言语才能的好奇和探究才能。

现在人工智能技能阅历了几十年的崎岖和开展,现代人工智能使用也变得越来越智能化和传神。递归神经网络(RNN)和生成对抗网络(GAN)等深度学习技能的呈现,也让 AI 可以更好地舆解人类言语,并生成愈加天然和流畅的文本、图画、音频等内容。

到了 2022 年,这是生成式 AI 的打破之年,最具代表性的便是 ChatGPT,其一经发布便引起了广泛的关注和讨论,被认为是天然言语处理范畴的一次重大打破。3 月 15 日,OpenAI 继续发布了其多模态的训练大模型——GPT-4,在 ChatGPT 的基础上增加了强壮的识图才能,模态更丰富,且研制速度之快,令人惊叹。

除对话聊天工具外,AI 在其他范畴也取得了不小的打破,3 月 16 日,Midijournry V5 发布,可发明高质量、高分辨率、高传神的图画。Runaway 于 3 月 20 日发布GEN-2 视频生成模型的试用请求,新增依据文本和图片生成视频的功用。3 月 22 日,代码保管渠道 GitHub 再次发布重磅“炸弹”:GitHub Copilot X,用户只需“动动嘴”,它就能帮你把代码写了。

回顾技能的开展,咱们可以发现,每一轮技能革新,都带来了产业级的投资机会。先行觉悟的人,会在其中获取巨大的利益,而后知后觉的人大几率是被社会推进着走。

例如互联网诞生起就催生了在线教育、数字娱乐和交际网络等新兴职业,进一步推进了人类沟通和信息传输的范畴开展。

智能手机的呈现让用户不再受限于键盘和鼠标,带来了移动支付、共享经济、使用开发等一众产业机会,进一步改变了人们的消费和生活方法。

5G 技能的遍及,也使得人们将可以更智能地与物联网、无人机、自动驾驶汽车等连接,这不只催生了智能交通、智能物流、智能制造等新的产业链,而且也让传统职业趋向数字化、自动化方向转型。

以生产工具为标志的生产力的开展是社会存在的底子基石,也是历史的第一推进力。这是马克思主义关于生产力理论的经典观念。历史的前进和社会革新都源于生产力和生产关系的开展和革新。生产工具越是先进,其生产力就越是强壮。而现在 AIGC 技能好像便是革命性的生产工具。

AIGC 技能正在阅历新一轮的革新浪潮,其交互方法也从生成文本、代码、图片正朝着更多元、更天然的方式上开展。历史总在循环往复,互联网的交互方式开端也是从文本、到图画、到音视频再逐渐开展到现在的互动音视频(直播)。现在 AIGC 也正朝着愈加传神的方向开展,随着技能的不断晋级和深化,AIGC 将可预见地颠覆音视频范畴。

大咖经历共享

AIGC 现已开端重塑音视频哪些细分范畴了?距离 AIGC 全面赋能音视频职业还有多远?未来会不会呈现愈加智能化、高效化的音视频使用与创作方式?会不会有愈加天然、智能的语音交互呈现?

4 月 26 日(周三)晚 20:00,「TVP 技能夜未眠」第七期来啦,本期咱们特别约请了腾讯云直播、媒体处理专家工程师 赵军教师与上海交通大学电子工程系教授、图画所副所长、腾讯云TVP 宋利教师,与咱们一同讨论 AIGC 在音视频范畴的使用与开展。

从文本、图像到音视频,AIGC技术将如何重构我们的数字世界?

讲师介绍:

赵军:腾讯云直播、媒体处理专家工程师

腾讯专家工程师, 开源爱好者,FFmpeg maintainer,现在在腾讯云音视频负责视频云的媒体处理框架以及优化等作业,一同也以敞开的心态,继续在开源社区提交相关 Patch。

宋利:上海交通大学电子工程系教授、图画所副所长、腾讯云 TVP

上海交通大学电院、人工智能研究院、未来媒体网络协同立异中心教授、博士生导师,IEEE 高级会员,多媒体信息范畴技能专家,图画通讯与网络工程研究所副所长。主持国家 863 课题、天然科学基金等科研项目数二十余项,宣布学术论文 200 余篇,授权发明专利 35 项,软件著作权 5 项。

添加云小助微信:tvp1215,回复「音视频」即可参加本次直播沟通群,可以提前沟通互动,并参加群内互动抽奖!

TVP技能夜未眠

TVP 技能夜未眠 —— 技能畅言,夜深不眠。聚集最新、最热、最受关注的技能论题,约请各范畴资深专家对话 TVP 大咖,深度分析技能原理,洞察互联网技能走向,碰撞出思维火花,照亮技能之夜。