Cloudflare CTO就全球故障致歉:我们辜负了客户和更广泛的互联网
IT之家 11 月 19 日消息,北京时间昨晚,Cloudflare 因核心服务的一个漏洞引发严重故障,波及全球。不只是 X、ChatGPT,甚至连用来查故障的 Downdetector 都受到了影响。这次故障也被IT之家小伙伴调侃:上次 Amazon 挂壁带走了半个互联网,这次 Cloudflare 带走了剩下半个。
服务恢复后,Cloudflare CTO Dane Knecht 公开致歉说,此次事故“不可接受”,并指出一次例行配置调整触发了机器人防护层崩溃。
故障从 11 月 18 日协调世界时 11:48 左右开始。Cloudflare 状态页最初仅显示“内部服务性能下降”,但问题迅速扩大,多地用户反映访问大量由 Cloudflare 支撑的网站受阻,连 Access 和 WARP 也无法正常使用。Cloudflare 随后确认,机器人防护工具中的某个依赖是事故源头。
Knecht 说:“Cloudflare辜负了客户和更广泛的互联网。例行配置调整后,机器人防护底层服务的潜在漏洞被触发并开始崩溃,最终导致网络与其他服务大面积受影响。这不是攻击。”
到协调世界时 14:42,Cloudflare 完成修复并逐步恢复服务。仪表板的分析和错误日志功能在下午仍不稳定,工程师持续观察是否还有残留问题。作为应对措施之一,伦敦地区短暂关闭了 WARP 访问。
Cloudflare 的机器人防护体系包括 Turnstile 等挑战流程与 JavaScript 验证环节,直接串联在大量知名网站与 API 流量路径上。由于这些组件不仅拦截恶意流量,也负责放行正常用户,一旦出现故障,即便 CDN 或 DNS 核心服务完好,也足以造成全网级别的混乱。
据外媒 Tom’s Hardware 报道,这次是近一个月内第三次重大宕机事故。10 月,AWS 的 US-East-1 区域因 DNS 配置损坏而停摆超过 2 小时。数天后,微软又遭遇大规模 Azure 宕机。
这连串事件引发更多质疑:全球主流平台在超大规模运行时,究竟能否有效隔离内部故障和系统依赖。约 19% 的互联网依靠 Cloudflare,而 Azure 和 AWS 在云市场的占比分别约为 24% 与 30%。
延伸阅读:
三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库
AI时代,真是啥都要快。三行代码构建一个AI应用,现在就这样被蚂蚁OceanBase游刃有余地实现了。熟悉数据库的朋友都...
苹果下一任CEO候选名单曝光:3位高级副总裁成热门人选
据TechWeb,苹果公司正在为库克明年卸任CEO做准备,董事会和高管团队正在加快寻找合适的接班人。目前,苹果下一任CE...
vivo S50 Pro mini手机官宣全球首批搭载第五代骁龙8移动平台
IT之家 11 月 19 日消息,vivo 通信科技有限公司产品经理韩伯啸今日宣布,vivo S50 Pro mini ...
快手Q3成绩单公布:经调整净利润50亿元 可灵AI营业收入超过3亿元
11月19日,快手-W(01024.HK)公布第三季度业绩。财报显示,本季度快手总营收同比增长14.2%至356亿元,其...
派特鲜生退场,侯毅:不建议再开宠物食品实体门店
盒马创始人侯毅的二次创业项目派特鲜生提前退场。11月17日晚,侯毅在一场直播中确认,计划在12月中旬关闭所有派特鲜生线下...
