阿里云又挂了

就在双十一如火如荼的进行时,阿里云又双叒出问题了

双十一,阿里云又双叒出问题了

为什么说又,由于就在不久前,语雀就由于云服务问题呈现了毛病,在8小时后才得以康复。 但这次毛病影响的规模较前次相比就大得多了,不光语雀呈现了问题,淘宝、钉钉等APP均收到了影响,许多依赖阿里云的产品也受到了影响。 “淘宝又崩了”“闲鱼崩了” “阿里云盘崩了”“钉钉崩了” 等论题连续登上热搜。知道的认为云服务呈现了问题,不知道的还认为马云跑路了。

双十一,阿里云又双叒出问题了

不久后阿里云发布公告,承认了影响的规模

双十一,阿里云又双叒出问题了

大约在8点左右,服务连续康复

双十一,阿里云又双叒出问题了

不知道是否有了前次的经验,这次修正问题的速度快了很多。只用的三个小时就修正了问题。 前次语雀呈现了问题,给广阔用户赠送了会员,不知道这次毛病又能给大家带来多少”福利”。

怎么处理毛病

说完阿里,要是真是咱们在实践遇到了这种问题改怎么处理呢

  1. 首先咱们要承认毛病产生的原因,有或许虽然是咱们担任的服务在不停的报错,但问题的本源不在咱们这里,这时咱们要及时的向上反应,找到上游的同学,共同承认问题的原因
  2. 假如在修正装备或上线代码后产生了报错,不要想 首要的便是将装备或代码回滚,康复问题比承认原因愈加重要,问题能够下来后慢慢复盘,但对用户构成的影响是很大的。
  3. 假如自己掌控不住局势或许承认不了原因,及时摇人。仍是那句话,优先解决问题,其他的都是次要的。
  4. 假如承认了问题的原因,及时向上级和受影响的团队阐明原因,千万不要闷头一向干,每逢有进展及时通报。在制定修正的临时方案时也最好拉上团队的小伙伴,防止二次问题。每次刷数据或许修正的代码上线前一定要第二个人review,否则忙中出错就更是添乱。假如时间充裕,能有测验同学帮助测验那是最好的。
  5. 在问题解决后,也要总结经验教训,无论是好的仍是坏的。这对咱们都是一次生长,做的好的当地在团队内能够推行,构成准则规范。做的坏的也找原因,防止下次呈现同样的问题。

结尾

有一说一,阿里的技能才能在国内也是数一数二的,但在近期却频繁产生这样的问题,不仅是对自身产品的不担任,更是对广阔用户的不担任。异地多活这种不应该只呈现在面试中,更应该在实践中落地。作为技能开发者,任何时候都要对系统坚持敬畏之心,一个小小bug就或许导致事务上的重大损失。