当前位置: 首页 » 资讯 » 新科技 » 正文

亚马逊云服务宕机,我家的猫饿了整整一天

IP属地 中国·北京 果壳 时间:2025-10-21 18:15:31

猫咪无法进食、多邻国打卡无望、金拱门外卖不能下单……

甚至当你早上醒了,想眯着眼睛刷会儿 Snapchat,都发现是永远的“连接失败”。

切换到 Venmo,想付给室友前两天的外卖钱,结果卡在支付页面转圈圈;算了,打把《部落冲突》清醒一下吧,游戏匹配界面卡在“正在连接”上,半天没反应。

小猫在门外嗷嗷叫,你开门一看,自动喂食机一夜没出粮。非是不信邪了。你叫 Alexa 放首歌试试,它只回了一句“抱歉,无法响应”。

不相干的糟心事情背后,都是亚马逊云宕机惹的祸——就像一场“赛博世界末日”的预演。


可怜猫猫,离线要饭|图源:小红书

这时,门口传来响声,你到门前一看,Ring 门铃的摄像头也失灵了,连昨晚的监控视频都没录下。

门突然被打开,原来是你的室友。他哭丧着脸说:AWS 挂了,机场的调度系统死机了,我回来的飞机在跑道上排了两个小时!


谢邀,人在跑道,下不了飞机|图源:小红书

这不是科幻末日电影里的场景,而是昨天无数人的亲身经历。

脆弱的数字化世界

一切的罪魁祸首?是亚马逊的 AWS 云服务。

这个支撑着全球三分之一互联网基础设施的“隐形巨人”,在美东当地时间10月20日凌晨 3:11(北京时间 15:11),US-EAST-1(美国-东部-1)多个服务出现“错误率增加和延迟”。

一小时后的 4:26,故障急剧升级,流量均衡器崩溃。短短数小时内,从你我日常刷的社交软件、在线游戏、智能家居,到大企业、金融机构、教育平台,皆在这一刻“掉线”。


影响巨大丨Down Dectector

互联网流量监测平台 Down Dectector 数据显示,有超过 2500 家公司受到影响,超过 1100 万条用户在此期间汇报了各种服务中断的问题,全球数百万网民的数字生活被按下暂缓键,开始无限魔力转圈圈。


美国几大城市都在报告问题|图源:Down Dectector

先说社交媒体和即时通讯,Snapchat、Signal 都出现了服务问题,数百万用户报告称,发不了消息,刷不了 Stories(类似朋友圈),甚至有许多用户因反复尝试登陆,导致账号被锁定。

游戏玩家们更是“躺枪”,《堡垒之夜》、《罗布思乐》等热门在线游戏,直接服务器挂机,玩家要么登录后黑屏,要么战斗中途掉线。Steam、Xbox、PSN、育碧的部分服务器也都受到影响。

其他常用工具也没幸免:像语言学习 app 多邻国、约会 App Hinge、出行服务 Lyft,还有社交论坛 Reddit 都报告了不同程度的故障:Reddit 刷不出贴,Hinge 用户抱怨匹配页面加载失败,Lyft 打不到车,多邻国打不了卡。


部分受到影响的平台|图源:X

玩不了游戏,发不了消息,正好放下手机“数字排毒”,但赚不了钱才是真要命。

Venmo(PayPal 旗下的支付 app)宕机了,让用户无法付款和转账,小企业主欲哭无泪;Coinbase 加密交易所也中招,用户登录卡顿,交易订单堆积如山;Robinhood 和 Webull 等股票 app 全线崩溃,投资者眼睁睁看着市场波动却下不了单;同时,星巴克、麦当劳的 app 也出现了访问问题。

政府机关也受到影响,苏格兰银行发帖称“AWS 影响了英国许多网站和程序,包括我们的服务。”用户都用不了网上银行。英国税务、支付和海关当局的网站也都掉线。


企业级影响同样惨烈,Zoom 会议断断续续几乎不可用,Canva(设计工具)错误率飙升,设计师们无法导出海报,项目延误;教育平台 Canvas 瘫痪,学生上不了网课,交不了作业;政府网站如部分联邦服务也短暂下线,健康保险网站能登录,但拉不出理赔记录……


AWS 宕机最大受害者(不是)|图源:小红书

智能家居也是受害者重灾区。亚马逊自家的 Alexa 语音助手一停摆,语音控制家电成空谈,有网友称“Alexa 闹钟一响就关不掉”,评论区网友跟帖:“我家 Alexa 和 Echo 都挂了,定的闹钟一点没响”。


《黑镜》都写不出的真实段子|图源:小红书

Ring 智能门铃服务也挂了,用户看不了监控,甚至打不开房门。还有用智能车库的特斯拉车主,打不开车库门。就连美联航的机场调度系统都受到了影响。


评论区有人补充说自己车库门开一半,掉线了|图源:X

迪士尼+、Apple TV、Prime Video、Netflix、Twitch 都遭遇大规模无法连接或卡顿问题,宅在家里无事可做。

之前人们用“蝴蝶效应”来形容复杂系统的脆弱性:一只蝴蝶在巴西扇动翅膀,可能在两周后在德克萨斯州引起一场龙卷风。

如今,这只蝴蝶换成了AWS 的服务器,只要它在弗吉尼亚的机房里轻轻“抽风”一下,半个互联网的屋顶就会塌。

无数网站、app、物联网设备、支付系统像一串串多米诺骨牌,全线塌陷。

生活在云端

当你看到这里时,AWS 的服务器已经修复,但网友们还陷在那几个小时无限加载的恐慌里:原来支撑现代生活的那张数字之网,这么脆弱的吗?

要理解这次大规模故障,首先得认识一下 AWS 是什么。

AWS,全称 Amazon Web Services,它是亚马逊旗下的云计算服务平台,亦是一个数据中心、服务器机群和网络节点遍布全世界的巨型网络服务平台。

它就像现代互联网的“电网”和“水管”,我们并不直接看到它,但几乎所有的数字生活都在靠它运转,即互联网最重要的“基础设施”之一。全球上百万家公司把网站、应用、数据库都托管在 AWS 上。


此次故障的 US-EAST-1 站点|图源:路透社

而这次出问题的“US-EAST-1”区域,是 AWS 在弗吉尼亚州北部的旗舰数据中心集群,也是它全球业务的核心节点之一。根据业内人士分析,这个区域承担着过高的负载,很多全球知名网站、金融系统、API 服务都默认部署在这里。

根据亚马逊的初步解释,事故源于内部一个监控网络负载均衡器的关键系统出错,引发大面积连接失败。

通俗点说,即 DNS 解析(域名系统,相当于互联网的“电话簿”)出了岔子,系统找不到正确的“地址”,各大网站就像看不到收货地址的外卖员,手里拿着饭却不知道该送给谁。

这本是可控的小故障,但在修复过程中又触发了“级联效应”:为了止损,工程师关闭了一部分入口,却导致新的服务器无法接入,流量分配再次紊乱。越修越乱,一环扣一环,就像一场小车祸让整个市中心大堵车一样。

截止到当地时间下午6时左右,亚马逊旗下服务健康仪表板更新显示,其服务已“恢复正常运行”。


亚马逊在云计算领域的份额|图源:路透社

“蝴蝶效应”为何会引发?

核心原因在于云计算的“集中化魔咒”。

AWS 是云市场的“老大”,占全球 30% 的份额,而 US-EAST-1 是它的旗舰区域,亚马逊在这里砸了 500 亿美元建数据中心,吸引了无数企业“安家”。根据 AWS 网站上的文档,US-EAST-1 站点是许多 AWS 服务的默认站点。

为了省钱和便利,很多公司把核心数据全堆在这里,没做足够的“多区域备份”。这就相当于把所有鸡蛋放一个篮子,篮子晃一下就全碎了。

同时,AWS 的系统就像一座极其精密咬合的机器,任何一个子系统的异常,都可能像倒下去的一块多米诺骨牌,让整个系统短暂崩溃。

强大来源于高度整合,而脆弱也是因为过于集中。

这次短暂的宕机也让无数公司和网友意识到,我们的生活、公司、政府服务是不是过于依赖某家公司的服务。互联网的理想是分布式与开放,但现状却是集中与垄断。

我们所认为“随时可用”“永远在线”的背后,就是一张由少数几家巨头所搭建的网络。一次短暂的宕机,为我们敲响了警钟。

作者:糕级冻雾

编辑:沈知涵

封面图Morning Brew


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。