之前花时刻研讨了一下云本钱办理和优化,算是有一些收成,我今天把这些分享出来,算是抛砖引玉了,如果有朋友有更好的方法或许好的文章,也欢迎推荐给咱们。

一、头脑风暴:云本钱优化的方法有哪些?

首要,咱们看一下,在企业说要做云本钱优化的时分,咱们都能够做什么?

企业面对FinOps,到底能做些什么?总结了4个方面

如上图所示,咱们所有的行为分为 4 大类,分别是可见性、运用功率、定价功率、操控。

1、可见性

能够经过系统或工具,把公有云账单和事务资源运用情况相关起来,做到及时(延迟尽或许做到 12 小时至 48 小时之内)检查账单数据或许图表展现。例如能够随时检查近一周的某个组织、某个项目、某个标签的耗费,都耗费了哪些资源等等。

2、运用功率

这个模块能够做的许多,但需求投入的人力本钱也比较大。

搁置资源: 包括 2 种,一种是能够独立运用的资源运用率长时刻低于 1%,例如搁置的虚拟机实例、搁置的 RDS 实例、搁置的负载的实例等,这种资源一般能够做收回再分配或许直接释放;另外一种是不能够独立运用的资源,这种资源一般需求依附在可独立运用的资源之上,例如未挂载的硬盘、未挂载的公网 IP 、未相关的 https 证书等,这种资源一般能够直接释放。

超配资源: 这种资源相较于搁置资源来说,它有负载,可是运用率长时刻较低,例如运用率长时刻在1%~30%之间,这种资源能够在不影响事务的情况下,下降它配置,以节省本钱。一般来说,负载或运用率提升一倍,可节省的本钱要超越 50%。咱们某个互联网客户,在施行 FinOps 之初,只重视事务对应的平均 CPU 运用率,在确保事务安全运转的情况下,拟定指标涨一倍,节省本钱近 60%。

守时关机: 某些按需付费的资源,只有在作业时刻内运用,其他时刻都是空跑,这种也会给企业带来本钱糟蹋,例如某些按需运用的开发资源、测试资源等,不仅是常用的虚拟机,其他的资源类型也会存在这个问题,常见的比方 RDS 实例等,这些资源都是能够经过守时关机来下降费用,咱们假定资源每周运用 5*10 也便是 50 个小时,其他时刻关机可节省 70%。

发动参数: 现在的公有云已经十分老练,尽管是同一款产品,可是在不同的场景下,它的发动参数(创立参数)也会有所不同,当然,带来的收益也是不一样的。换句话说,一种场景如果运用了不合适的发动参数,它所带来的本钱也是天壤之别的,例如虚拟机光实例类型就不下七八种,同样是 8 核 16 G,最贵的和最廉价的相差 10 倍。而且更恶心的是,同一款产品,不同的公有云,发动参数也不尽相同。这种资源就需求深入了解公有云提供的产品特色以及企业的运用场景做出合理的选择,才干很好的规避本钱糟蹋。除了这种比较有深度而且耗时刻研讨公有云产品的方法,还能够及时重视或许参加公有云厂商每年的大会(例如 AWS 的 re:Invent、Google Cloud 的 Next )来获取高价值的新功用,一般这种重量级的会议发布的一些亮点功用,会大大的下降本钱的一起提高用云的质量。举个例子,Google Cloud 在 2022 年的 Next 大会上发布了其在方针存储(Cloud Storage)的新功用 autoclass,该功用旨在用户无需了解不同的存储等级,只需求运用 autoclass 就能够自动将不同读取频率的文件设置相应的存储等级,从而到达节省本钱的意图。当然,像这种还有许多,例如在创立 k8s 集群时,能够选用 spot 实例来承载容错率比较高的事务从而节省超越 50% 的本钱。

架构优化: 架构优化有大有小,大的比方说从传统的部署形式改为微服务架构,当然这种本钱比较高,但收益也会比较高;小的或许便是配置运用或许改造服务令其具备水平扩展的能力,运用类似于服务器组弹性弹性,到达只为需求的资源付费。总体上来讲,每次架构优化和升级都会带来功率的提升和本钱的下降,否则,咱们也没有动力做这件事。

反常运用: 反常运用的情况其实比较多,咱们没有办法尽头,但从表现上能够分为 2 种,一种是在云本钱可视化图表上有着显着的波峰也便是费用反常波动,这种能够经过简略或许复杂的算法去辨认到;另一种,一直都是错的,不仔细看底子无法发现,例如同在一个公有云的区域里边,经过公网拜访方针存储的资源,产生互联网流量,这种只能经过剖析账单、熟悉云核算、熟悉产品收费形式等下苦功夫。

3、定价功率

许诺用量: 像国内常用的包年包月、AWS RI、Azure 世界的 RI 、Azure 中国的 CPP、Google Cloud 许诺运用折扣等等,这些都归于许诺用量,能够带来至少 40% 到 80% 的节省。

定价形式: 这里想表达的意思是,在公有云上,同一款产品一般具有多种收费模型,一起处理同一个需求又有着多种产品,在获取相应资源的时分,重新审视要选择的产品以及付费形式能够带来本钱上的优化。例如同样是处理核算问题,有着服务器核算、容器核算、无服务器核算、函数核算等等,在确保事务正常的情况下,不同选择带来的本钱也是不一样的。

账单等级: 在国内,感觉应该叫大客户折扣,某些大客户具有独享的折扣,很深很深。

4、操控

预算办理: 经过为部门或许项目以及在某个产品或服务设置预算,而且设置相应的预警,超越预算相关人员就会收到相应的报警告诉,归于后置的办理手段。

配额约束: 经过为部门或许项目设置配额,来约束其运用资源的上限,这种归于前置的办理手段。

二、本钱优化矩阵

咱们把每种事项的复杂程度以及节省作用绘制成一个本钱优化矩阵,以指导咱们日常 FinOps 的动作。

企业面对FinOps,到底能做些什么?总结了4个方面

经过上图,咱们能够很轻松的辨认到,企业在施行云本钱办理和优化(FinOps)的动作中,优先考虑右侧象限的定价功率、操控、可见性以及架构优化,实现快速下降云本钱的意图。左侧象限动作复杂性较高,需求长时刻学习和坚持,才干到达预期的作用。

三、云联壹云的产品做到了哪些?

从上边的 4 大模块来讲,第三方的工具只能环绕可见性、操控、运用功率这 3 个方面做一些测验。咱们尽管也在这 3 个方面都做了,可是,咱们在可见性和操控方面做得比较全面,这个对企业来说也是刚需,最直观的感受便是先要把公有云的账算清楚,才干谈其他的。从 2018 年帮助 VIPKID 做云本钱办理开始,到现在陆陆续续接了几十家客户的云本钱办理的需求,首要也是根据 6 大公有云做一些处理和剖析,再加上多云办理平台里边天然有资源、事务等数据,整合起来,经过不同维度数据组合,而且可视化的展现出来,能够帮到企业客户把账算清楚,让云本钱可运营可治理。

企业面对FinOps,到底能做些什么?总结了4个方面

运用功率方面(也便是本钱优化主张相关的功用)很早的时分也做了一些,而且咱们把这些问题资源都筛出来,经过相关账单,把采取相应动作之后,可节省的费用也统计出来,就能够从定量的角度评价费用优化的价值,不过,这件事情叫好不叫座。究其原因其实便是优化方针的辨认还不行精确,而且还需求人来做,未来我觉得这个模块应该能够更自动化或许更智能一些(没有安全危险的前提下)。

企业面对FinOps,到底能做些什么?总结了4个方面

有需求试用咱们的云本钱办理和优化(FinOps)处理方案的,能够经过咱们的官网(www.yunion.cn/finops)联系到咱们。