美國社群網站臉書(Facebook)4日發生大當機,造成股價下跌4.9%,臉書創辦人兼執行長祖克伯(Mark Zuckerberg)的個人資產也蒸發近60億美元(約新台幣1674億元)。
經過6小時的維修後,臉書以及旗下的應用程式IG、WhatsApp已經恢復正常。
外界一度懷疑當機是駭客所為,不過臉書工程及基礎設施負責人賈納丹(Santosh Janardhan)在官方部落格上表示,此次大當機和管理、協調全球臉書數據中心的骨幹網路當機有關,承諾會加強檢查、測試,避免此類事情再度發生。
骨幹網路(backbone network)又被稱為「核心網路」,負責連接各式網路,使不同區域網路(LAN)、子網(Subnetwork)能交換訊息,將同建築物或區域內不同網路連接在一起。
臉書在全球設有多處數據中心,有些負責儲存大量數據、運算複雜程式,其餘則將骨幹網路和一般網路以及用戶所在的網路連結,以供上網。
路由器則是網路連接裝置,負責決定網路數據傳輸的路徑,所有電腦設備的數據傳輸都是由路由器管理,大型企業的路由器較複雜,會將企業的網路和更強大的核心路由器連接,沿著骨幹網的光纖線路高速傳輸數據。
賈納丹指出,臉書進行日常維護時會讓骨幹網路的一部份離線以便修復光纖線路、擴增容量或更新路由器硬體設備。事發當下,工程師正在維修時,電腦意外發出「評估全球骨幹網容量可用性」的指令,而原本工程團隊設計、避免此類事情發生的系統卻沒有發揮作用,導致骨幹網路對外連接中斷、臉書當機。
當臉書數據中心和網路連接中斷後,網域名稱(DNS)也無法讀取,工程師沒有辦法通過正常的方式進入數據中心,DNS故障也讓諸多用來調查網路斷線問題的工具無法運作。
“Hello literally everyone”: Twitter flooded with users during Facebook, Instagram outage https://t.co/pYPMNGyjR7
— The Washington Post (@washingtonpost) October 5, 2021
當主要網路以及獨立管理的帶外網路(out-of-band)都無法運作後,工程師直接前往數據中心,檢查、排除問題並重啟系統,但由於數據中心的安全系統縝密,需要花費較多時間才能啟動網路存取安全協定,確認問題並讓骨幹網路重新連線。
賈納丹強調,儘管臉書已經恢復運作,但問題尚未結束,因為一口氣將網路連接、上線可能會造成新一輪當機,對供電系統造成龐大負荷,所幸臉書團隊平日有針對類似突發狀況進行演練,對相關系統進行壓力測試,最後在沒有系統故障的情況下成功恢復網路。
他坦承,每次失敗都是學習、成長的最佳時機,之後不論問題大小,團隊都會進行廣泛的檢查,以便了解如何讓系統變得更有彈性。
臉書當機後,外界一度懷疑是否有駭客介入,不過美國西佛羅里達大學網路安全中心助理主任蓋瑞特(Guy Garrett)指出,這起案件不太可能是駭客所為,「這種大規模的當機不是典型的駭客攻擊,駭客確實有可能造成這樣的狀況,但需要動員跨國駭客社群、投入大量資源才能扳倒臉書。需要精心策畫才能辦到。」
祖克伯也在5日針對全球大當機一事道歉:「抱歉造成不便,我很清楚你們有多依賴我們的服務、用以和你所關心的人保持聯繫。」
世代傳媒股份有限公司
信箱:service@upmedia.mg
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
地址:新北市新店區寶橋路188號8樓
關於我們探索網站
地址:新北市新店區寶橋路188號8樓
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
e-mail:service@upmedia.mg