︿

臉書公布大當機原因 骨幹網路維修出包有關

盧睿鋐 2021年10月06日 12:30:00
臉書大當機,造成股價下跌4.9%。(湯森路透)

臉書大當機,造成股價下跌4.9%。(湯森路透)

美國社群網站臉書(Facebook)4日發生大當機,造成股價下跌4.9%,臉書創辦人兼執行長祖克伯(Mark Zuckerberg)的個人資產也蒸發近60億美元(約新台幣1674億元)。

 

經過6小時的維修後,臉書以及旗下的應用程式IG、WhatsApp已經恢復正常。

 

外界一度懷疑當機是駭客所為,不過臉書工程及基礎設施負責人賈納丹(Santosh Janardhan)在官方部落格上表示,此次大當機和管理、協調全球臉書數據中心的骨幹網路當機有關,承諾會加強檢查、測試,避免此類事情再度發生。

 

 

骨幹網路(backbone network)又被稱為「核心網路」,負責連接各式網路,使不同區域網路(LAN)、子網(Subnetwork)能交換訊息,將同建築物或區域內不同網路連接在一起。

 

臉書在全球設有多處數據中心,有些負責儲存大量數據、運算複雜程式,其餘則將骨幹網路和一般網路以及用戶所在的網路連結,以供上網。

 

路由器則是網路連接裝置,負責決定網路數據傳輸的路徑,所有電腦設備的數據傳輸都是由路由器管理,大型企業的路由器較複雜,會將企業的網路和更強大的核心路由器連接,沿著骨幹網的光纖線路高速傳輸數據。

 

臉書創辦人祖克伯出席聽證會。(湯森路透)

 

賈納丹指出,臉書進行日常維護時會讓骨幹網路的一部份離線以便修復光纖線路、擴增容量或更新路由器硬體設備。事發當下,工程師正在維修時,電腦意外發出「評估全球骨幹網容量可用性」的指令,而原本工程團隊設計、避免此類事情發生的系統卻沒有發揮作用,導致骨幹網路對外連接中斷、臉書當機。

 

當臉書數據中心和網路連接中斷後,網域名稱(DNS)也無法讀取,工程師沒有辦法通過正常的方式進入數據中心,DNS故障也讓諸多用來調查網路斷線問題的工具無法運作。

 

 

當主要網路以及獨立管理的帶外網路(out-of-band)都無法運作後,工程師直接前往數據中心,檢查、排除問題並重啟系統,但由於數據中心的安全系統縝密,需要花費較多時間才能啟動網路存取安全協定,確認問題並讓骨幹網路重新連線。

 

 

賈納丹強調,儘管臉書已經恢復運作,但問題尚未結束,因為一口氣將網路連接、上線可能會造成新一輪當機,對供電系統造成龐大負荷,所幸臉書團隊平日有針對類似突發狀況進行演練,對相關系統進行壓力測試,最後在沒有系統故障的情況下成功恢復網路。

 

他坦承,每次失敗都是學習、成長的最佳時機,之後不論問題大小,團隊都會進行廣泛的檢查,以便了解如何讓系統變得更有彈性。

 

 

臉書當機後,外界一度懷疑是否有駭客介入,不過美國西佛羅里達大學網路安全中心助理主任蓋瑞特(Guy Garrett)指出,這起案件不太可能是駭客所為,「這種大規模的當機不是典型的駭客攻擊,駭客確實有可能造成這樣的狀況,但需要動員跨國駭客社群、投入大量資源才能扳倒臉書。需要精心策畫才能辦到。」

 

祖克伯也在5日針對全球大當機一事道歉:「抱歉造成不便,我很清楚你們有多依賴我們的服務、用以和你所關心的人保持聯繫。」

 






【加入上報國際圈,把繽紛世界帶到你眼前!】

提供新聞訊息人物邀訪異業合作以及意見反映煩請email至國際中心公用信箱: intnews@upmedia.mg,我們會儘速處理。

 

 

 



回頂端