作者:莫源
前语
中华财险是国内互联网金融职业的领导者,在企业云原生上云的过程中,完成了很多多租SaaS化事务的微服务化和容器化。其事务具有十分典型的金融属性,对架构稳定性、资源本钱功率、数据安全等方面都提出了更高的要求和应战,需求在完成降本增效的同时兼顾事务稳定性。在搬迁的过程中,遇到了多租事务清算本钱难、搁置/糟蹋资源发现难、优化战略与事务稳定性平衡难等应战。中华财险工程师团队基于阿里云企业云原生IT本钱办理方案沉积了一套老练的IT企业本钱办理流程与体系,经过开箱即用的事务本钱拆分、搁置资源可视化发现、弹性弹性与混部等优化战略,将集群的搁置资源率从上云前的30%优化到10%以内。
中华财险的上云IT本钱办理工作也荣获信通院2022年度云管和云网优异事例:mp.weixin.qq.com/s/XBOcLcW9C…
中华财险的云原生之路
云原生上云是现在企业上云的最佳途径,中华财险作为国内互联网金融职业的领导者也在驱动事务经过微服务化、云原生化的方式完成数字化转型。在云原生上云之前,中华财险的事务存在如下问题:
- 事务资源的办理权限分散在各个团队,生产环境和测试环境下沉在事务团队,事务团队为暂时验证的版本冗余了很多的资源。
- 部分事务有明显的周期性,峰谷容量相差较大,造成资源低负载运转时刻较长。
- 压测环境单位时刻内需求很多的暂时机器,复用搁置资源需求腾挪机器、协调跨团队资源,流程和本钱较高。
- 缺少可量化的目标发现事务的糟蹋,单纯的利用率目标不能作为糟蹋的评判规范。
为了处理上述问题,中华财险工程师团队经过事务的微服务化、容器化的方式,将事务搬迁到了阿里云容器服务之上,基于阿里云企业云原生IT本钱办理方案沉积了一套老练的IT企业本钱办理流程与体系,将IT本钱的办理周期从本来的季度、月度,下降到了周、天。经过开箱即用的本钱可视化与分摊才能,实时衡量团队资源糟蹋状况,完成数字化的降本增效。
下面是一些优化过程中的要害途径:
- 经过命名空间进行多租事务的逻辑办理、财资拆分、糟蹋衡量
中华财险工程师团队将多租的SaaS化事务经过命名空间作为逻辑单元在同一个集群中进行统一办理,经过调整Request与Limit之间的份额,将原有独立容量办理的模型,转变为池化统一办理,提高资源的利用率。经过阿里云企业云原生IT本钱办理方案提供的命名空间本钱核算的才能,在一个集群内能够轻松完成不同事务的费用分摊,完成容量办理与财资办理。
经过ACK本钱分析发现集群糟蹋状况以及各运用本钱分布
- 全量路压测进行容量预估与可靠性验证
在进行云原生化的过程中,中华财险工程师团队发现,事务团队提交的容量预算与实际的资源运用存在比较大的偏差。因而,在上云的过程中,中华财险工程师团队经过运用PTS(阿里云全链路压测服务)高仿真模拟环境全链路压测,确定体系水位和瓶颈,合理预估资源需求,将本钱规模经过数字化的目标进行了建模,在保证集群容量可靠性的前体下,完成了本钱规模的操控。
- 建立本钱糟蹋的衡量规范,发现糟蹋状况
单纯经过资源利用率的数值来判别事务是否存在糟蹋从实际场景上来看是不行有说服力的,事务团队冗余容量的战略一般会基于事务峰值的状况、程序高效运转的利用率区间、未来事务发展的状况等要素。在传统的本钱办理周期以月度、季度乃至年度等更长时刻的状况下,冗余是保证稳定性的最佳挑选。为了处理这个问题,中华财险工程师团队提出了运用糟蹋度模型,经过结合资源利用率、波峰波谷振幅、事务断路器引入、事务本钱趋势改变等多个要素进行整合,数字量化糟蹋份额,有用的发现了集群内的实在糟蹋状况。
经过 ACK 本钱分析发现集群运用的糟蹋状况
- 分时混部在线事务与暂时事务错峰运用
在中华财险的事务场景中,有很多的暂时使命、仿真使命,这些使命具有周期短、资源耗费高等特性,中华财险工程师团队发现集群的实在运用率在白天一直处在比较低的水平,而闲暇的时刻足够仿真使命和暂时使命的履行。此外,在运用分时复用的时分,还配合了快上快下的抢占战略,既保证了集群的全体利用率提高,又能够在突增流量到来的时分,下线暂时作业保证事务的全体的稳定性。
- 定时弹性完成中心事务资源预供给
中华财险有些事务存在明显的周期性和波峰波谷,资源份额相差数倍,在保证一定冗余的状况下,经过运用定时弹性的方式,能够让出更多的集群的调度资源,让其他的暂时作业能够跑得更快。
- 搁置资源收回与事务弹性交给
当资源池化后,因为不必节点的调度战略打标和约束,会造成部分节点的调度水位较低,经过识别长时刻低水位的节点的方式,能够发现集群中的搁置资源状况,下降资源糟蹋。并把一些低频度的资源交给经过弹性的方式进行优化,完本钱钱功率的进一步提高。
中华财险基础设施团队一路走来,经历了线上生产事务从传统IT架构到上云、上云原生的过程,在这个云原生化的过程中,中华财险的事务量也翻了数倍。经过云本钱优化的一系列办法,某事务容器化后总下降装备:232C 400G ,节省约7台 32C 64G 的ECS的云计算资源,下降了约20%的服务器本钱。在进行了混部、事务高峰低谷的弹性弹性等优化后,平均本钱优化率可达约15%。
最终
从某种角度而言,中华财险基础设施团队的架构优化战略是十分朴素和实用的,经过数字化、模型化、可视化企业IT本钱,用数据辅导和优化IT本钱办理,将集群的搁置资源率从上云前的30%优化到10%以内。企业IT本钱办理历来不是新技术的试验场,挑选合适自身状况的方案,用数据量化成果,有理有据地驱动企业降本增效。
相关文章:
《阿里云首家经过《可信云云本钱优化东西才能要求》评估,云原生企业 IT 本钱办理方案助力企业 FinOps