自2018年软银发生重大通信故障以来,日本再次发生重大网络事故。

当地时间2021年10月14日下午5点左右,运营商NTT DoCoMo的移动网络在全日本范围内发生重大通信故障,导致大量手机用户无法进行通话和数据通信。

此次事故影响范围广,震惊全日本上下。

事故发生后,日本总务大臣在内阁会议后的记者招待会上表示:

作为关系人们日常生活的重要基础设施,移动网络发生了大规模故障,令人遗憾。总务省对此事非常重视,已要求NTT DoCoMo及时调查和报告事故原因和影响程度,以向广大用户做出充分的解释。希望NTT DoCoMo能履行好社会责任,并采取一切可能的措施防止类似事故再次发生。

NTT DoCoMo管理层公开道歉,对于此次事故给客户和很多人带来了不便,深表歉意,并表示将努力防止事故再次发生。

打开网易新闻 查看更多图片

NTT DoCoMo管理层公开道歉

故障描述

NTT DoCoMo官网表示,从2021年10月14日下午5点左右开始,发生了导致DoCoMo语音通话和数据通信服务难以使用的网络事故。

2021年10月14日下午7点57分,该运营商采取了紧急网络操作,故障开始逐渐恢复,但由于网络拥塞,仍然有一些客户无法连接网络。

2021年10月15日凌晨5点05分,5G和4G网络恢复正常,但部分区域的3G网络仍然难以使用,正在努力恢复中,并告知广大用户,已订阅4G套餐并显示3G信号的用户,可以通过重启手机的方式来连接4G网络,以获得正常通信。

2021年10月15日下午,NTT DoCoMo副社长在新闻发布会上表示,3G网络恢复“无法给出明确的时间”,并解释说前景不明朗。

故障原因

10月14日,NTT DoCoMo官网解释,由于在网络建设中进行“切换”操作,引起网络信令增加,而导致网络拥塞。

10月15日,NTT DoCoMo召开新闻发布会进一步详细解释了故障发生原因。

具体原因如下:

10月14日凌晨,该运营商着手对存储物联网终端设备的用户/位置信息的服务器进行升级,用新的设备替换旧设备。

图片来源:NTT DoCoMo

但接下来发生了意外,大约有20万台物联网终端的位置信息从旧设备迁移到新设备的过程中,出现了问题。

10月14日下午4点36分,在发现问题后,启动了回退操作,重新倒回到旧设备。

打开网易新闻 查看更多图片

图片来源:NTT DoCoMo

但这一回退操作,引发了大量物联网终端向旧服务器重新发起位置注册信息,一股汹涌而来的“信令风暴”快速引发了网络拥塞,并于下午5点左右,波及3G/4G/5G网络的语音和数据分组核心设备,导致大量用户无法通话和数据通信。

图片来源:NTT DoCoMo

NTT DoCoMo表示,突发而来的信令流量比预期的要高很多。

看起来,这是一起因网络割接失败而导致的网络重大故障。

此次事故引发了日本各界反思。故障发生后,很多网民表示,网课被迫停课,乘坐出租车无法使用智能手机支付,看电影无法在现场显示电子票......给日常生活带来了极大的不便。

通信行业研究机构和媒体评论道,当前,移动网络已成为像水、电、气一样的社会基础设施,一旦出现重大故障,对人们的日常生活影响极大。而进入5G时代,网络要连接家电、工厂机器、自动驾驶汽车等,如果发生重大故障,影响会更大。因此,监管机构和电信行业应加强冗余备份,以确保网络的可靠性和稳定性。

通信路上,一起走!