大屏幕切换成2ms系统界面,密密麻麻的案例标题瀑布般滚动,“现在这里躺着4760个实战案例,光是跨国故障处置就有542例。”
林雨晴悄悄调暗灯光。
阴影中,陈默照得棱角分明:“我一直强调运维不是救火队,而是要把每一次故障处理变成可复制的经验,要把这些经验变成能传承的武器。现在,舞台交给你们。”
第一个上台的是erp财务领域支持部的张伟,作为主管的他算是给开了个好头。
他分享的案例是 “德国子公司年终结账系统崩溃应急处理”。
屏幕上弹出的是2015年12月31日的监控截图,密密麻麻都是红色报警点。
“当时德国时间23:00,正是他们的财年结账高峰期。” 张伟推了推眼镜,“我们发现erp系统的物料凭证过账模块卡住了,初步排查是多时区数据同步导致的锁表。但德国同事坚持说本地运维已经做过三次重启,问题依旧。”
台下传来轻微的议论声。
张福全在笔记本上画了个问号,胡笳则在手机上快速调出德国时区的运维手册。
“重点不是技术排查。” 张伟点击下一张ppt,“而是跨国协作中的信息不对称。我们让德国同事录制了操作视频,发现他们在调用中国服务器的物料主数据时,没有启用时区转换函数。这不是技术故障,是流程漏洞。”
他展示了优化后的跨时区数据同步流程图,右下角标注着 “已录入全球运维知识库,避免12个国家子公司出现同类问题”。
当张伟提到通过调整api调用逻辑,将该模块结账时间从8小时压缩到2小时时,后排的年轻工程师们纷纷拍照记录。
第二个案例来自oa支持部的李媛,就是前段时间被胡却敢搞得心力交瘁已经想离职的那头快牛。
他分享的是 “流程引擎逻辑漏洞修复”。
投影幕布上是oa系统的审批流界面,红色箭头标出了两个部门同时申请会议室时的随机分配逻辑。
“这不是简单的系统漏洞。” 李媛的ppt背景是他亲手画的流程图,“当研发部的技术评审会和行政部的例会