158 字
1 分钟
亚马逊披露全球宕机原因:单点竞争错误引发连锁故障
亚马逊披露全球宕机原因:单点竞争错误引发连锁故障
亚马逊公司披露,近期导致全球多项云服务中断的 AWS 宕机事件由 DynamoDB 系统中的软件缺陷引发。问题源于 DNS 管理模块的竞争条件,使两个并行组件在高负载下互相冲突,最终导致数据库崩溃。 故障最早发生在美国东部数据中心,进而影响 EC2、Redshift、Lambda 等主要服务。亚马逊表示,已暂停相关自动化机制并着手修复漏洞,以防止类似事故重演。
Ars Technica
亚马逊披露全球宕机原因:单点竞争错误引发连锁故障
https://blog.kismetpro.ggff.net/posts/kjpd36732/