当前位置: 首页 » 资讯 » 新科技 » 正文

亚马逊云服务宕机15小时冲击上千家企业,云依赖风险已凸显

IP属地 中国·北京 21世纪经济报道 时间:2025-10-21 20:09:22

21世纪经济报道记者董静怡10月20日,社交媒体开始流传起亚马逊网页上的各类小狗图片,显示页面加载失败,亚马逊的买家和卖家们戏称,“今天是看狗的一天”。



崩掉的不只是亚马逊自己的电商网站。社交平台Snapchat、交易平台Robinhood、PayPal旗下的移动支付Venmo、加密货币平台Coinbase、人工智能初创公司Perplexity等大量依赖AWS的互联网平台均受到波及陷入瘫痪。

根源是亚马逊云计算服务AWS遭遇大规模宕机,美西时间10月20日下午3点,持续约15小时的服务故障得到解决。据Downdetector数据,超400万用户报告了这次故障引发的问题,至少一千家公司的服务受到冲击。

不过,尽管发生如此严重的大范围服务中断,亚马逊股价却并未受到很大影响,10月20日逆势收涨1.61%至216.48美元/股。

“AWS这样成熟的云厂商发生故障,暴露出了云厂在基础设施可靠性和容错性设计方面的一些薄弱之处,但IT界尤其是大公司发生技术故障并不少见。”IDC中国研究总监刘丽辉向21世纪经济报道记者表示,“该故障发生可能会引发部分客户的担忧,但还尚不足以对竞争格局产生太大影响。”

大型云服务厂商此前均出现过故障,波及多个大型网站,这仍引发了业内对于全球数字化基础设施脆弱性的担忧。尤其在AI带动云计算需求爆发式增长的时代,如何构建既高效又可靠的云基础设施,成为摆在企业和云服务商面前的共同课题。

AWS的护城河

美西时间10月20日凌晨12点左右,AWS的核心节点之一美国东部1区(US-EAST-1)首先报告出现“显著的错误率和延迟”现象。

位于美国弗吉尼亚州北部的“US-EAST-1”数据中心是AWS历史最悠久、规模最大的服务器集群之一,也是许多AWS服务的默认区域,其稳定性问题直接影响全球互联网生态。

此次故障的根源在于AWS关键数据库系统DynamoDB。这一故障引发骨牌效应,导致依赖该数据库的多项AWS服务出现连锁反应。亚马逊工程师在故障发生后迅速定位问题,并开始修复,但由于云服务各组件间相互依赖,全面恢复耗时长达15小时。


图源亚马逊AWS健康状态页面更新

不过令人意外的是,尽管发生如此严重的大范围服务中断,亚马逊股价10月20日却逆势收涨1.61%至216.48美元/股。比起AWS中断,投资者显然更关注的是亚马逊云部门的长期增长潜力。

很长一段时间,AWS都是亚马逊的核心利润部门,该业务2024年收入达1076亿美元,占亚马逊总收入的17%。运营利润达398亿美元,同比增长约62%,占总营业利润的58%。

市场研究机构Synergy Research Group数据显示,AWS占据全球云计算市场约30%份额,其余主要厂商包括微软和谷歌。

在业内看来,云服务市场的进入壁垒日益增高,现有巨头的规模效应和客户锁定能力已形成强大护城河。AWS的市场领导地位形成的网络效应使其具备强大的客户黏性,即使偶发服务中断,企业客户也因高昂的迁移成本而难以轻易转向竞争对手。

“这次故障尚不足以对竞争格局产生太大影响,企业在选择云厂商时会考虑基础设施地域覆盖、技术先进性、成本、安全、服务支持等多方面因素,AWS依然是综合实力最强的云服务商之一。”刘丽辉向记者表示。

有分析指出,宕机事件可能会促使企业增加在网络安全上的投入,云和数据中心提供商可能因此受益,而某种程度上仍包括亚马逊。

不过,投资者们关注的增长故事也并没有那么好讲,今年以来AWS经历更大的竞争和挑战。第二季度,亚马逊AWS营收虽达309亿美元、同比增长17.5%,明显落后于微软Azure的39%和谷歌云的32%,引发市场对其龙头地位动摇的担忧。

在决定未来云服务市场格局的人工智能领域,微软和谷歌要更早、更快布局,AWS已承诺今年在AI领域的投资将高达1000亿美元,以加快数据中心和软件的建设。

而随着竞争加剧和投资增加,AWS作为亚马逊利润引擎的角色也在发生变化。2025年第二季度,AWS的经营利润为101.6亿美元,对亚马逊整体经营利润的贡献为53%,已基本降至一半。而在一年前的2024年第二季度,AWS的利润贡献曾高达64%。

月底即将到来的第三季度财报,市场也会更加关注。

构建更可靠的数字地基

虽然亚马逊并未受到大程度影响,但这次事件的波及面之广仍然引起了广泛的探讨:在追求效率与成本最优化的同时,企业是否忽视了风险?

当前,云服务已成为数字世界的基础设施,而AI的快速发展更是加速了其扩张。当企业竞相拥抱生成式AI和大型语言模型,它们对云计算的依赖只会加深。

对大型企业而言,数小时的云服务中断就意味着数百万美元的生产力和收入损失。根据网际网络性能监控公司Catchpoint的估算,AWS此次服务中断造成的经济损失将至少达到数十亿美元。

而这并非AWS首次大规模服务中断。2023年6月13日,AWS曾宕机持续近4小时,美东区域多个服务受到中断。

2021年12月7日,AWS其中一个数据中心遭遇故障,导致服务中断长达5小时,包括航空公司、汽车经销商、支付应用程序以及视频服务等都受到严重影响。

对用户来说,尽管依赖AWS、微软Azure和谷歌云等大型云服务商,在多方面提升了全球网络安全与稳定性,但企业选择单一的云服务巨头往往是既有利也有弊。

几次大规模的宕机显示出,这些云平台正成为众多关键服务的单一故障源,暴露出了冗余不足、替代方案缺位。不少专家指出,太多公司把“鸡蛋”全放在一朵“云”篮子里。

网络安全公司NymVPN首席数字官Rob Jardin在一份简报中写道:“互联网最初的设计宗旨是去中心化、高韧性,可如今我们的线上生态却高度集中于少数几个云区域。一旦其中一个区域出错,冲击便瞬间扩散、波及全网。”

面对风险,企业也在重新审视其云方案。刘丽辉向记者表示,该故障可能会引发部分客户的担忧,进而影响他们对于多云选择的思考。

混合云架构正在成为降低风险的重要方案,通过将关键工作负载分布在多个云服务商之间,或保留部分核心业务在私有云中,可以有效避免单一厂商锁定带来的系统性风险。

业内人士分析称,多云策略虽然会增加初始复杂性和管理成本,但在发生大规模服务中断时,能够确保业务连续性,从长远看具有明显的风险抵御价值。

在不可逆转的云端迁移大潮中,构建弹性、多元、韧性的数字基础设施,已从可选项变为必选项。这次宕机最终会平息,但它留给企业的关于风险管理的思考,还会持续影响未来的技术决策和投资方向。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。