算力年代,视频云需求怎样的CPU?
在数据爆发式添加及算法日益精进的大布景下,归于「算力」的年代俨然到来。跟着视频成为互联网流量的主角,日趋饱和的音视频场景渗透率、人类对“感官之限”的寻求与突破、更多元化的场景探索及技能需求,为视频编码才能和底层算力及硬件支持带来更大的应战。
“视频云作为音视频职业的基础设施,能极大地简化视频从收集、处理、编码、传输到分发的全链路流程。”正如阿里云视频云技能担任人在《芯事》访谈中所说到的,阿里云视频云与倚天710一同,正在踏上视频普惠千行百业的新征途。
点击链接查看视频:www.eefocus.com/video/14627…
视频云与倚天710的结合
2022年北京冬奥会,阿里云承接了一项重要的使命,那便是支撑冬奥全面上云。为此,阿里云视频云推出了全新的云上创新解决方案——阿里云聚“Alibaba Cloud ME”,这也是全球榜首次在奥运会上完成异地全息会面,是一次打破时空之距的革命性创新。在感叹云上沉溺之旅的精妙之余,咱们不由要问,阿里云视频云上路即狂奔的硬实力是什么?除了使命必达的斗争精神和强大的软件、算法支撑才能以外,阿里云视频云技能担任人致凡还说到了倚天710。
当咱们将目光投射到倚天710上,会发现它诞生于2021年,是一款由平头哥自研的云芯片,经过一年多时间的硬件布置和事务验证,倚天710实例已成功使用到阿里巴巴集团的中心事务中,并服务多家知名互联网及科技公司。正是基于前期优良的体现,倚天710已在阿里云数据中心布置,未来布置规模将继续扩展。
当然,没有一款芯片生来就如此强大,视频云技能担任人谈到:“视频云和倚天710的结合是一段夸姣的旅程,但中心仍是阅历了十分多的工作。”
回忆起这段旅程:“由于视频事务的添加快度是十分快的,研发一颗芯片的周期也十分长,不论是芯片研发、仍是芯片落地后适配视频云事务生长,都是极具应战的,但咱们一同做好了正视应战、突破壁垒的预备。当榜首版芯片流片回来后,芯片基本功能体现安稳,且由于Arm架构带来的原生优势,再加上阿里云和平头哥的同学双方坐在一同,在了解芯片内部构成的基础上去做了许多算法调优后,可以让代码在芯片上跑得更快。
一起,倚天710还针对特定算法场景进行了指令集加快与优化,比方像SVE等矢量计算技能,其间BF16/INT8 mmla指令可完成高效的矩阵乘法运算,还支持Hash、CRC32等加快指令,可以让单条指令并行处理更多数据,大幅进步视频编解码、AI编解码增强等场景功能,这是一个两头一同迭代的过程。”
所以,从最早的功能应战传统架构CPU,到现在现已远远超越传统架构CPU,倚天710的“蜕变”是一步一个脚印走过来的。视频云技能担任人认为:“这是一个十分好的案例,阿里云视频云的事务跟平头哥的芯片规划可以完美地结合在一同,利用各自的优势让芯片规划出来,在视频职业中发挥更大的作用。”
谈起平头哥和阿里云视频云事务的这次协作,就不能不说到一个大的工业布景,即视频云的爆发式添加。至于什么是视频云?“视频云就像是音视频职业的水和电,是底层的基础设施,可以大大简化视频从收集、处理、编码、传输到分发的链路。”这个比方再恰当不过。
社会视频化在狂飙
从2017年开始,短视频的热度继续上升,加上近三年疫情下直播、视频会议、线上教育等范畴的崛起,社会视频化成为一种大趋势。依据CNNIC发布的第50次《我国互联网络开展情况计算陈述》数据显现,到2022年6月,我国移动互联网接入流量达1241亿GB,同比添加20.2%;另依据思科发布的数据显现,视频内容约占互联网总流量的90%,占移动网络总流量的64%。
结合这两组数据,咱们可以得出视频正在成为互联网流量的主角,而爆炸性的数据量又将会对算力和存储提出更大的应战。于是视频云的价值被凸显出来,并呈现出了一种不可逆的开展态势。在这样的大布景下,全球以互联网公司为主的科技企业纷繁转型,敞开视频云技能的探索之旅,并在安防监控、长途医疗、零售电商以及金融机构等典型场景中得到落地。
当时,视频云工业现已形成了相对安稳的头部战队,包含微软、AWS、阿里云等干流云厂商。关于国内视频云的商场体量方面,依据IDC发布的数据显现,2022上半年我国视频云商场规模到达50.5亿美元,同比添加15.7%,估计到2026年,商场规模接近300亿美元。值得一提的是,经过陈述显现,阿里云视频云接连5年占有我国视频云全体商场份额榜首,并且渗透率还在不断攀升。
视频工业倒逼技能迭代
关于视频云工业来讲,以在线视频为例,从最早国外的Livestream、国内的斗鱼直播到现在,现现已历了25年的前史,其实从技能的角度来看,整个职业开展的速度没有幻想中的快。比方,视频编码从H.264到H.265,再到H.266,平均10年升级一代。为什么速度不是很快?由于它要解决的问题比较多:算力、网络传输、标准等等。可是,咱们看到今天的视频工业开展十分迅猛,这也倒逼技能要去完成快速迭代。这几年现已初显效果,比方现在编码器的升级迭代速度是5年,以前是10年,估计后面可能是3年。
为什么这里要着重编码?事实上,视频云是一个算力密集型职业,视频信息量很大,假如采用和文本、图片一样的压缩模式,那么复原度是不行的,所以视频必须进行编码处理。编码要是做欠好,不仅会损失视频质量,还会带来传输难度高的问题。从MPEG2开始,每一代视频编码的升级,其压缩率大约可以进步50%,远低于视频分辨率每更新一代进步4倍的速度,即便这样,每一代升级对CPU算力的需求,以及算法复杂度都会进步至少10倍以上,这对芯片的架构、芯片底层的指令集优化、芯片的存储器和cache结构都会带来新的应战,许多中心的算法要用新的指令集从头写一遍,这意味着视频编码和芯片生长是需求同步的。
视频云需求怎样的CPU?
经过前面的介绍,咱们了解到视频编码对算力的要求很高,由于咱们常常试图用算力换存储,用算力换传输带宽,所以咱们希望算力越高越好。
那么如何进步CPU的算力?首先要选择好的内核架构。在视频范畴,传统架构现已有三十几年的前史了,目前市占率依然能到达90%以上的份额,但裹挟着沉重的向后兼容包袱。而Arm作为一种精简指令集,不仅没有前史包袱,还可以依据需求添加许多寄存器,一起从内存cache结构的规划和指令集的规划上面,可以更贴合需求大算力的视频处理需求。此外,不管是Hyper-Threading仍是其他,采用传统架构的CPU走的都是进步主频的路子,在视频处理时就会遇到一些问题,比方视频压缩的时分会分红I帧、P帧、B帧,每一帧的算力并不是平均分配的,就会带来对算力需求不安稳的问题。
所以为了让芯片不跑超频,就可能会做一些降频处理,这时分它的算力就可能达不到相应的编码需求。在实践事务中,由于视频事务不是单机运转的,会有许多的服务器集群合作来处理,为了避免CPU跑超等复杂情况的出现,就不得不把服务器集群的水位下降,这是传统架构CPU比较大的问题。
然而,Arm全体的规划是比较安稳的,不管使命有多复杂,都能完成安稳输出,做到杰出的资源分配和水位分配,不必预留许多冗余来避免芯片跑超,这关于to B事务来说十分重要。除了主频高以外,传统架构CPU的核不多,通常是两个vCPU/HT共享一个物理核、1份ALU,但Arm可以完成128/256/512或更多的核,类似GPU的规划,如此一来,关于不同使用场景而言,就可以用少核应对低算力需求的场景,多核应对高算力需求的场景,完成更优的事务分配,下降投入成本。以倚天710为例,内含128核CPU,主频2.75GHz,可适配云的不同使用场景。
与此一起,跟着数据上云越来越多,关于数据中心而言,功耗功能也是十分重要的,对运营者来说,低功耗就意味着低成本,除了软件层面的优化以外,倚天710能一起兼顾高功能和低功耗。
以上要素叠加,就让视频云的头部企业阿里云与倚天710的结合看起来水到渠成。当时,倚天710已大规模布置并提供云上服务,依据实践反馈,倚天710让阿里云平台的算力性价比进步了超30%,单位算力功耗下降了60%,这是一个相当大的进步。
探索一种平衡
纵观视频云工业,人们对体验的极致寻求,将成为视频云继续深耕的动力。在云使用场景下,CPU的开展之路将循着算力、I/O、网络协议适配、推理才能、从无到有的发明才能不断演进下去。未来,Arm会成为视频云中一种重要的架构,全体份额一定会添加,但不会是唯一的架构,传统架构、异构的ASIC和FPGA都会有一席之地。而关于Arm架构而言,未来的改进方向是下降功耗、进步算力、做好专用性和通用性的选择平衡。
一起,咱们要意识到,未来视频对算力的应战是十分高的,简略地靠CPU的升级现已满意不了需求,需求一些特殊的处理,包含越来越多的AI算法、专用算法,比方模型搜索的算法等,再把通用的模块部分地固化在芯片里面,极大地进步视频处理的效率。
所以在视频云商场,人们总是在做权衡,云芯片厂商要处理好芯片能效和通用性的联系,云服务商要在算力有限的情况下使用许多快速算法。 而正如阿里云视频云技能担任人所着重的:“咱们的愿景都是一样的,便是让视频普惠各行各业,再反哺视频职业,完成更健壮的开展。”