年4月26日,由中国信息通信研究院(以下简称“中国信通院”)主办的“稳保计划”——首届云系统稳定性大会”在京召开。会上,中国信通院公布了“稳保计划”云系统稳定性领域的最新成果以及混沌工程先锋实践者优秀案例结果。
混沌工程作为保障分布式系统稳定性的重要技术,已成为推动企业IT韧性系统建设的强大助力。为促进混沌工程创新发展,交流行业内先进经验,引导国内企业更好地应用混沌工程,提升国内云系统稳定性建设水平,中国信通院在混沌工程实验室的协助下,开展了首届“混沌工程先锋实践者”优秀案例评选活动。案例评选历时4个月,对国内一批成熟度高、具有示范标杆作用的优秀混沌工程实践案例进行了调研和评选,包括前期宣传、企业申报、材料审核、公开投票及专家评审五个环节,最终有16个混沌工程优秀案例脱颖而出,覆盖互联网、软件、银行、证券、通信、零售、能源等行业和领域,点击查看完整获奖名单。
关于永辉超市
永辉超市成立于年,年在A股上市,股票代码.SH,是中国企业强之一,是国家级“流通”及“农业产业化”双龙头企业。永辉超市是中国大陆首批将生鲜农产品引进现代超市的流通企业之一,被国家七部委誉为中国“农改超”推广的典范,通过农超对接,以生鲜特色经营及物美价廉的商品受到百姓认可,被誉为“民生超市、百姓永辉”。
未来,永辉超市将继续坚守主业、坚守定位、坚守文化,以满足用户多场景消费需求为导向,发力品牌年轻化,营造好逛、好玩的新型门店,并坚持以科技赋能供应链,以数字驱动增长,建立起质量更高、效率更高的全渠道运营体系,成为“以生鲜为基础,以客户为中心的”科技零售企业。
YH-Chaos混沌平台介绍
混沌平台核心组件架构图:
永辉混沌工程平台支持故障演练能力模型比较丰富,有+原子故障能力可以模拟业务上面可能遇到的各种故障类型,常用的故障类型如下:
1.系统级别故障:CPU升高、内存满载、网络延迟、丢包、阻塞等
2.容器级别:杀掉容器、容器重启
3.K8s级别:杀掉POD、重启POD
4.应用级别:
HTTP服务调用接口延迟或异常、
Dubbo服务调用延迟或接口异常
5.数据库服务连接池满载异常、慢SQL故障延迟
6.常见中间故障类型如:MQ、ES、Redis等
混沌演练只需要在平台上面做出简单配置即可发起演练,业务线无需修改代码即可实现注入故障。
永辉科技内部落地混沌工程先以核心业务线链路做前期故障演练价值体现,内部开展多轮混沌工程全员培训教学,宣扬和推广故障演练文化和价值。
平台收益
在混沌工程平台落地之后,永辉超市电商全渠道都开展相应的混沌测试拿到的价值点如下:
1
验证电商系统全渠道大促保障预案的正确性和服务可用性
2
锻炼业务线团队核心成员的故障处理时效能力和提高响应速度
3
发现上百个业务线系统核心监控指标缺失
4
验证数千个系统服务高可用保障手段正确性
对于内部混沌平台愿景是直面生产可能出现的各种故障,提前模拟探测业务架构上面的薄弱点,能帮助业务线更好的服务于客户,提高业务系统稳定性。
同时技术团队也会和混沌实验室其它会员单位持续合作,共同建设混沌工程优秀实验项目。
混沌工程实验室后续将推出《混沌工程先锋实践者优秀案例集》,欢迎大家持续