BGP路由问题导致的全球故障持续了六个多小时后,Facebook、instagram和WhatsApp开始重新上线。
今天,东部标准时间上午11:50左右,这三个网站突然无法访问。浏览器在尝试打开它们时显示DNS错误。
Facebook首席技术官迈克·施罗普费尔(Mike Schroepfer)在推特上向全世界的用户道歉,但他们没有解释发生了什么。施罗普费尔此前曾在明年初宣布辞职。没想到,在过去的三个月里,他遇到了如此尴尬的局面。
今天,东部标准时间上午11:50左右,这三个网站突然无法访问。浏览器在尝试打开它们时显示DNS错误。视频号码
用户在尝试直接连接到以下Facebook DNS服务器时无法访问这些服务器。
由于DNS协议将网站的IP地址告知用户的操作系统和浏览器网站,并且DNS服务器无法访问它们,因此无法连接到它们。
虽然问题一开始似乎与DNS有关,但后来发现问题比这严重得多。
亚马逊AWS的首席技术客户经理Giorgio Bonfiglio解释说,各种Facebook路由前缀突然从互联网的BGP路由表中消失,这实际上使用户无法连接到其IP地址上承载的任何服务。
边界网关协议BGP是现代互联网运营的基石,它决定了世界一端的计算机如何连接到另一端的设备。
为便于理解,BGP路由协议类似于Internet“邮政系统”,它便于将数据包从一个(自治)网络系统传输到另一个(自治)网络系统。
如果一个网络想要被互联网上的大多数系统或用户看到,他们需要向世界宣布他们的路线或前缀。
如果删除这些前缀,互联网上就没有人知道如何连接到他们的服务器。
由于Facebook将其组织配置为使用托管在其自身路由前缀上的域名注册器和DNS服务器,一旦这些前缀被删除,任何人都无法连接到这些IP地址和在其上运行的服务。
从美国东部时间下午5点开始,Facebook路由前缀开始出现在其他网络的BGP路由表上。由于这些前缀现在已经在互联网上公布,用户可以再次连接到Facebook、instagram和WhatsApp。
目前尚不清楚是什么导致了今天的故障,但很可能是由于配置错误,就像过去许多其他与BGP相关的故障一样。
由于Facebook的电子邮件服务器也因故障而无法访问,以前由bleeping计算机发送的电子邮件被返回。
这是这家科技巨头自2008年以来最严重的一次失败,当时一次失败使Facebook瘫痪了近一天,但其服务当时只有8000万用户。
Facebook股价周一收盘下跌5%。