职位描述
1 、分析和识别云服务的稳定性与高可用的薄弱点,发掘并抽象故障场景,给出解决方案并推进落地与验证;
2 、参与系统性梳理公有云核心系统和设施的容灾技术方案,推动和参与核心服务的容灾能力建设;
3 、组织大规模线上压测、故障演练、预案演习,使系统能有效治理风险和快速故障应急;
4 、建设蓝军能力,负责演练验收能力与工具平台建设,数据化驱动系统容灾容错能力的持续优化。
职位要求
1 、熟悉云基础产品服务架构,有 VPC 、NAT 、负载均衡等云网络产品研发经验者优先;
2 、熟悉公有云基础设施领域设计架构,有网络领域的架构设计、问题分析和处理经验者优先;
3 、对业务和基础设施高可用建设,容灾演练有丰富的实战经验;
4 、自驱,具备良好的沟通协调能力,逻辑性强,善于团队合作;
欢迎投递简历到 yuliang.666@bytedance.com |
|