苦练基本功,长期有耐心
04
02
系统稳定性建设杂谈 系统稳定性建设杂谈
在互联网领域,高性能、高并发、高可用相关的讨论屡见不鲜,三高问题中高性能和高并发大家工作中接触较多,对于高可用,往往是纸上谈兵。前几年提到高可用,什么同城容灾架构、异地容灾架构、两地三中心方案层出不穷,坊间还充斥着支付宝CTO剪网线、饿了么CTO主动做IDC断网测试等各种段子,美团在2019年也组织过GQ、YF机房整体断网演练。前几年业界内没有发生大规模的机房级别故障,我也会怀疑是否有必要投入高昂的成本来建设机房容灾能力。然而最近两年,先后出现亚马逊机房故障、美团0704故障到最近的阿里云香港机房故障,这些故障也印证了墨菲定律:如果事情有变坏的可能,不管这种可能性有多小,那么它总会发生。
2023-04-02