腾讯云复盘4月8日故障原因：持续近87分钟，1957个客户受影响

今日早间，腾讯云发文，对外公布复盘了4月8日下午发生的API服务故障事件。

腾讯云在《说明》中回应，此次故障自4月8日下午15点23分发现，至16点50分全面恢复，共持续近87分钟，期间共有1957个客户反馈了相关问题。导致客户无法通过控制台登录，并影响了部分公有云服务的使用。

故障发生时，客户登录控制台受阻，依赖云API提供能力的公有云服务如云函数、文字识别、微服务平台、音频内容安全、验证码等也受到了影响。

经复盘分析，此次故障的根本原因在于云API服务新版本向前兼容性考虑不足和配置数据灰度机制存在缺陷。新版本接口协议的变化导致旧版本前端数据处理逻辑异常，生成错误配置数据，并在灰度机制不足的情况下迅速扩散至全网地域。

针对此次故障，腾讯云团队表示将吸取教训，从提升系统韧性和强化变更管理与保护措施两方面着手改进。

第一，提升系统韧性
1、定期执行预定的变更策略模拟演练，确保在真实故障发生时，能够迅速切换到恢复模式，最小化服务中断时间。
2、优化服务部署架构，通过分层架构、代码审查和监控等手段，避免API服务中潜在的循环依赖问题。
3、提供API服务逃生通道，当故障发生时，可供调用方快速切换。
第二，强化变更管理与保护措施
1、完善自动化测试用例库，在系统变更前通过沙箱环境对变更内容进行严格验证。
2、实施灰度发布策略，逐步推广新功能或配置更改，按集群、可用区、地域逐步生效，以便在发现问题时能够迅速回滚。
3、引入异常自动熔断机制，当检测到系统异常时，能够立即中断变更过程。
第三，增强故障响应与沟通能力
1、对故障处理流程进行全面升级，确保实时更新故障处理进度和预计恢复时间点，提升故障报告发布效率。
2、在对外发布的故障通知中，清晰阐述受影响的业务范围、故障根因及预计修复时长，保持透明度。
3、优化腾讯云健康状态看板（StatusPage）的信息展示逻辑，解除对云API等云服务的依赖，通过引入缓存和容灾机制，确保即使在云服务出现故障时，能准确、及时地传递故障信息。

腾讯云复盘4月8日故障原因：持续近87分钟，1957个客户受影响

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

雷军回应“不应给年轻人太多建议”：每代人都有自己独特的想法

外交发言频繁使用“甩锅”，真的合适吗？

直播中的第三人：屏幕外的运营者

仅6周，“神剑”命中率就从70%降到6%！美国新军援专打俄军电子战

牛弹琴:拜登不小心说出美国的小心思日本印度都急眼了

劳斯莱斯库里南黑色五座流星顶618万特价提车

具俊晔在韩开的饭馆被曝光，大S遭吐槽：从大饭店跌落到小卖部了

小羽官宣分手连夜搬家，直播痛哭透露分手细节，曝王思聪真实人品

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

5月3日深夜，小S在社交平台高调发文，晒出了一张照片

驾驶员离开驾驶座让汽车“无人驾驶”？理想客服：该危险操作要坚决杜绝

当你有个卧龙凤雏员工日子有多精彩！老板：你是对家派来的间谍吧

疑似调侃阿劳霍！维尼修斯转发皇马年轻球员夺冠数据：新时代

俄在海参崴举行胜利日大阅兵，吸引全球关注

乌军成功将美国的ATGM FGM-148“标枪”集成到地面无人系统上

腾讯云复盘4月8日故障原因：持续近87分钟，1957个客户受影响

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

雷军回应“不应给年轻人太多建议”：每代人都有自己独特的想法

外交发言频繁使用“甩锅”，真的合适吗？

直播中的第三人：屏幕外的运营者

仅6周，“神剑”命中率就从70%降到6%！美国新军援专打俄军电子战

牛弹琴:拜登不小心说出美国的小心思 日本印度都急眼了

劳斯莱斯库里南黑色五座流星顶618万特价提车

具俊晔在韩开的饭馆被曝光，大S遭吐槽：从大饭店跌落到小卖部了

小羽官宣分手连夜搬家，直播痛哭透露分手细节，曝王思聪真实人品

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

5月3日深夜，小S在社交平台高调发文，晒出了一张照片

驾驶员离开驾驶座让汽车“无人驾驶”？理想客服：该危险操作要坚决杜绝

当你有个卧龙凤雏员工日子有多精彩！老板：你是对家派来的间谍吧

疑似调侃阿劳霍！维尼修斯转发皇马年轻球员夺冠数据：新时代

俄在海参崴举行胜利日大阅兵，吸引全球关注

乌军成功将美国的ATGM FGM-148“标枪”集成到地面无人系统上

牛弹琴:拜登不小心说出美国的小心思日本印度都急眼了