連自家員工也崩潰,為什麼 Facebook、IG 深夜大癱瘓?

社群媒體 Facebook、Instagram 及 WhatsApp 在台灣時間 5 日凌晨發生全球大當機,連台灣也受影響,不管網頁版或 App 都無法連上和登入,服務中斷超過 6 小時,終於早上 5 點多恢復運作。

Facebook、Instagram 及 WhatsApp 在 4 日晚上 11 點 30 分出現問題,今日早上 5 點多才陸續修復。目前台灣 3 平台恢復運作,不過部分國外網友報告在 Instagram 發新內容時還是有問題。

Facebook 在 Twitter 官方帳號今日凌晨推文,知道用戶存取應用程式時遇到問題,「我們正盡快讓一切恢復正常,造成任何不便,我們深表歉意。」不過 Facebook 並沒有公開哪裡出錯。
連 Facebook 員工都無法工作
外媒《The Verge》報導,Facebook 中斷導致員工溝通、工作系統一併當機,Facebook 員工爆料,他們只能使用 Outlook 信箱帳號聯絡,但員工無法接收外部地址的電子郵件。故障發生前已登入 Google Docs 和 Zoom 等工具的員工仍可使用這些工具,但任何需要工作電子信箱登入的員工全被擋掉。

據知情人士透露,Facebook 工程師已前往美國資料中心,試圖解決問題。

Facebook 大當機可能跟 DNS 有關?
科技網站「DownDetector」顯示,除了 Facebook 旗下 3 平台,Google、Telegram、Zoom 也可能出現類似中斷情形,這似乎是相當普遍的狀況,但無法確定多少用戶不能登入應用程式。
多位安全專家認為是網域名稱系統 (Domain Name System,DNS)出問題。思科旗下網路監控機構 ThousandEyes 認為,中斷就是 DNS 故障結果。

Cloudflare 高級副總裁 Dane Knecht 指出,Facebook 邊界閘道器協定(BGP)突然從網路消失,BGP 主要幫助網路選擇最佳路徑傳輸網路流量。

網路由多種路徑連結成「網」,跟 BGP 綁定運作。BGP 允許一個網路(如 Facebook)向其他網路宣傳它的存在,即跟其他 ISP 建立路由連接,但由於 Facebook 的 BGP 突然消失,因此其他網路找不到 Facebook 網路,就無法登入使用。

Cloudflare 追蹤全球網路所有 BGP 更新和公告,發現 Facebook 在美國時間 4 日 15 時 40 分 BGP 更新突然邁向高峰。同時 Facebook 路徑消失、DNS 伺服器下線,使 Facebook 及網站與網路斷開聯繫,結果全球各地區 DNS resolver 停止分析網域名稱。

歷經 6 個多小時嘗試後,透過 DNSchecker 測試 ISP DNS 伺服器顯示,美國時間下午 5 時 30 分成功找到通往 Facebook 的路徑。幾分鐘後,Facebook 和 Instagram 就恢復正常,但 DNS 修復需要時間,才能送達至所有人。

有些人猜測 Facebook 當機是駭客所為,或對前一晚舉報人的內部抗議,但目前還沒有任何相關資訊。

恢復正常後,Facebook 特地聲明指,對依賴 Facebook 龐大社群的全球網友、企業很抱歉,「我們一直努力恢復應用程式和服務登入,也很高興報告,現在已恢復網路,謝謝你們的支持。」

發佈留言