屏幕上播放了一个简短的动画演示:一个磁盘空间告警触发-平台自动定位主机-自动分析日志和空间占用-自动清理指定临时文件或发起扩容流程-告警自动恢复。
张福全在展示亮点工作的时候眼里好像有光,见陈默点头,声音都又高了几度。
“我们还建立了‘故障预演’机制。
每周例会,不再是念经报流水账,而是由各领域专家,模拟历史上发生过的重大故障场景,或者基于当前监控数据预测的高风险点,进行沙盘推演。
逼着大家提前想根因、想预案。
四个月,我们预演堵住了17个潜在的重大隐患。”
他点开一个案例,“比如这个,就是推演时发现某个核心数据库的归档策略在高并发月结时存在连锁崩溃风险,提前做了优化。”
张福全太了解陈默了。
他知道跟默总汇报,光说“结果好”没用,一定要挖出“过程”和“方法论”。
这套东西,还是当年默总手把手教自己的:问题要前置,根因要深挖,解决要成体系,别总当救火队长!
至于问陈默为啥这么懂,你去当几年救火队长试试,会让你恶心到吐。
经常凌晨3、4点被人一个电话叫到公司他真的受够了。
陈默听着,脸上依旧没什么表情,但微微前倾的身体和专注的眼神,表明他听进去了。
他手指点了点“资源优化”那部分:“省了2100台物理机?没影响性能?没埋下新的隐患?”
此刻张福全被问到这点以后心情直接美到起飞,默总,我提前预判了你的预判。
就知道会问这个!资源优化是双刃剑,省了钱但压榨过度就是定时炸弹。
“我们叫它‘三压一优’策略。”张福全说话像一个回答老师问题的小学鸡。
他调出详细的容量模型图:
“压闲置:通过更精细的资源画像,识别并下线长期低负载(10%)的‘僵尸’服务器,这块贡献了35%。
压冗余:重新评估了所有非核心系统的ha(高可用)策略和备份冗余度,在保障sla的前提下,合理降低部分系统的冗余资源配比,贡献了25%。
压浪费:推动开发团队优化了20多个高资源消耗应用的代码和配置,比如那个著名的‘内存吞噬者’报表引擎,优化后单实例内存需求降了40%。
最
点击读下一页,继续阅读 躺平摆烂二选一 作品《重生后我只做正确选择》第503章 预判了你的预判