當前位置: 華文世界 > 科技

拿什麽來拯救下一次「微軟藍屏」?

2024-07-26科技

文|徐嘉

編|園長

過去幾百年,7月19日都是沒什麽歷史大事發生的一天,唯一記錄在冊的,是1870年這天,法國向普魯士宣戰,普法戰爭爆發,就此給44年後第一次世界大戰的劇變埋下引線。

那時的電報還需要架電纜使用,6年之後貝爾才發明電話,26年之後,人類才實作史上首次無線電通訊,100年以後,手機才誕生。世界緩慢進入第二次工業革命的電氣時代,主要的資訊傳遞還要依靠紙質的信件和公開發表的報刊文章。那時的人類對於通訊這件事還非常耐心,一切訊息都經得起漫長的等待。

154年後的7月19日,世界多地的Windows系統,因為一個名叫Falcon的安全平台的更新故障而出現了大規模的藍屏。這句話很拗口,154年前的電報員恐怕永遠無法理解,這場賽博時代的「千裏之堤,潰於蟻穴。」

一塊藍屏停住半個地球

這天的藍屏被稱作史上最大的IT故障,甚至有人認為,這場事故是在預演潛藏在AI技術和IT行業裏的崩潰風險。

2024年的台北時間7月19日,世界各處有超過850萬台電腦卡在了同一個藍色界面。

圖源自網路

中國的許多外企員工在這天實作提前下班,卻又在咖啡店遭遇點單故障;

加拿大的Mago因此被取消了出差飛機,久違的在家體驗了刷劇、洗衣服和做飯的放松工作日;

ris在美國加州的舊金山機場遭遇4小時的飛機延誤,又在登機2小時後被趕下飛機,在無法取回托執行李的情況下無奈回家;

日本羽田機場的地勤則在這天為上百名乘客手寫登機和行李牌。

全世界的航空、物流、醫療、金融等多個行業都在這場故障中受到影響:

數以千計的航班延誤或取消;機場滯留遊客和行李出現擁堵;值機手續改為人工辦理;鐵路的列車位置資訊也無法同步;

特斯拉的生產線受阻;萬豪、凱悅、希爾頓和洲際等諸多國際連鎖酒店集團的網路作業系統停擺;

英國廣播公司無法播放早間新聞;多地的自動收銀系統受到影響;醫院的患者就診系統癱瘓;就連巴黎奧運會也因系統問題暫時了奧運證件啟用服務……

圖源自網路

在GPT引領的AI技術變革前夜,還會發生這樣一場因為一個bug席卷全球的網路災難,引起全球各行業的集體宕機,荒誕感令人錯亂不已。

這還不是一場故意為之的網路攻擊,而是一場草台班子式的塌房,少數錯誤程式碼「引發的血案」。

特別是它發生的時候很不湊巧,更多的人們開始焦慮,在即將到來的AI時代,一個同樣不起眼的bug,在AI的放大之下是否會引起更大規模、難以預測的後果?

因此,7月19日這天的停擺更像一種現代技術警示:再專業的安全軟體,也可能在設計或更新中出現紕漏。即使是科技巨頭,也會被一場小小的失誤絆倒。

到底發生了什麽?‍‍‍

藍屏的英文全稱是Blue Screen Of Death,縮寫為BSOD,一般是由硬體故障、驅動程式問題、軟體沖突、系統更新錯誤等原因引起。 這是Windows系統特有的崩潰顯示方式。

藍屏其實是程式設計師開發工作中的「家常便飯」: 「今天藍屏了,明天再努力吧」也是常有的事。 更廣泛的領域裏, Windows系統在過去幾年也曾偶爾出現過一些規模性的藍屏狀況,但從未像這次波及這麽多國家。

這次「史上最大IT事故」的藍屏現象出現在中國、紐西蘭、澳洲、日本、印度等多國,波及行業之廣前所未有。崩潰源頭直指網路安全公司CrowdStrike,其在調查之後宣布了造成系統崩潰的技術原因:

2024 年 7 月 19 日 04:09 UTC(國際協調時間),CrowdStrike監測到新的網路攻擊技術,於是向自家Windows 系統的Falcon軟體釋出了傳感器配置更新。這並非新操作,自Falcon建立以來,CrowdStrike就一直每日更新策略、技術和程式,傳輸給自家平台。

但在這次,其中的一個「通道檔」291號出現了邏輯錯誤,導致軟體在執行過程中依據錯誤規則,越界觸碰到了系統中的其他本不該接觸到的部份,這就緊急觸發了Windows系統的自我保護機制BSOD,即我們看到的世界範圍級藍屏。

事故的責任方CrowdStrike公司成立於2011年,是一家位於美國矽谷的網路安全公司,可以被視作「美國的360」。這家公司以揭露俄羅斯對美國民主黨全國委員會的網路攻擊而知名,為全球2.9萬家客戶提供終端安全,包括監測威脅情報、防病毒等在內的產品和服務,於126億美元的終端保護軟體市場中占據18%的份額,早在2019年6月於納斯達克上市。

CrowdStrike|圖源自網路

就在問題發生的當天下午,公司的執行長George Kurtz做出解釋,稱 這次發生的問題並非安全事件或網路攻擊 。但它還是對公司聲譽和客戶信任帶來了重大打擊,公司的市值一夜蒸發百億美元,股價暴跌。

作為與CrowdStrike緊密合作的科技巨頭,7月22日,微軟發言人在接受媒體采訪時,對此次藍屏做出補充說明,認為是歐盟的限制性措施引發了這次的全球故障。

2009年,微軟與歐盟達成協定,要給所有安全軟體開發商與自家軟體同等的系統存取許可權,讓像CrowdStrike這樣的第三方安全軟體,能輕松透過Windows系統執行極其深入且復雜的操作。 這在最初是為了確保安全軟體開發商擁有公平的市場競爭環境,但也削弱了Windows系統的安全性和可控性,在15年後間接造成了這場事故。

如果此後歐盟對微軟放松了限制措施,也授權以降低這類由第三方軟體帶來的系統崩潰,但其也將在市場中占據更大的市場份額,未來又會有什麽樣的風險,還不得而知。市場規範與科技發展的力量交互作用,在一次次網路安全事件後得到沖擊與重塑。

重提網路安全險和技術冗余論

2007年,電腦防毒軟體Norton(諾頓)在升級後,將Windows XP系統的兩個關鍵系統檔將作病毒清除,這次「誤殺」造成國內數百萬台電腦系統崩潰,出現藍屏、重新開機的現象,給國內經濟造成了難以預估的損失。只是在彼時,由於國內法律在資訊保安領域的空白,企業抵抗網路風險、挽回損失和維護權利的路徑尚不清晰。

諾頓「誤殺門」|圖源自網路

到了2024年7月的這次事故,全球已有超過15個國家和地區釋出了超過一百部的網路和數據安全法案,立法和監管推動了用於抵禦風險的網路安全保險市場的發展。

2019年的一項全球調查報告數據顯示,有超過一半的企業選擇購買網路安全保險,年收入超過10億美元企業的投保率更是有57%。

據【2022年全球網路安全保險市場報告】,2022年網路安全保險市場規模約為119億美元,預計到2027年將達到 292億美元。索賠頻率和嚴重程度也拉高了保費,2022年第一季度,僅美國網路保險的定價就上漲了110%。

整體來看,中國企業的網路安全意識和網路安全保險市場都起步較晚。 近20年,隨著企業數位化轉型,越來越多的網路安全問題開始出現。

2017年,一款名為WannaCry(想哭)的蠕蟲式勒索病毒就在中國等多個國家的企業、學校、醫院等地爆發並蔓延,這種病毒會強力封鎖電腦中的文件、圖片和程式,索取使用者以位元幣支付的贖金。多行業因此受到影響。

wannacry蠕蟲病毒|圖源自網路

類似風險還隱藏在企業員工可能遇到的網路釣魚連結中,給使用者和企業帶來諸多如資訊泄露、敲詐勒索、竊取資產、幹擾業務等網路安全風險。 【2022年風險晴雨表】就顯示,勒索軟體攻擊、數據泄露、遠端辦公導致的IT漏洞和雲平台數據供應鏈中斷,已經成為如今企業最擔心的4類網路風險。

隨著需求的增長,國內網路安全保險業務發展也在提速。【科技日報】報道稱,截至2023年7月,中國有37家保險公司(含外資、合資保險公司)提供89款在售網路安全保險產品(含附加險9款)。工信部、國家金融監管總局聯合印發了【關於促進網路安全保險規範健康發展的意見】。

這次的藍屏事件,或許將成為國內網路安全險發展歷程的又一個分水嶺。

在這次的藍屏事件中,美國安德森經濟集團的執行長預測,藍屏事件造成的損失可能高達10億美元。更具體的數位至今還難以估計,有預測其將達到15億甚至上百億美元。7月24日,馬來西亞方官員還公開要求微軟和CrowdStrike考慮賠償全球在藍屏期間遭受損失的公司。

而保險經紀公司Marsh McLennan稱,有超過75家客戶可能會因為CrowdStrike全球性崩潰事件而提出網路故障索賠。接下來,隨著核心技術問題被逐漸修復,眾多損失估算和索賠將陸續被提上議程。

從這場損失巨大的事故追根溯源,可以發現問題核心直指全球企業過於依賴單一產品,缺乏「冗余備案」的盲區。

微軟在全球擁有10億多使用者,卻將網路安全服務交給全球少數幾家公司。而作為占據了一定市場份額的一家龍頭安全服務公司,卻在臨近周末的周五,一次性向全球客戶推出了更新內容,連灰度測試也沒有。

約翰霍普金斯大學凱瑞商學院的資訊系統助理教授Javad Abed(賈瓦德·阿貝德)在接受采訪時就說:

「網路安全的基本原則之一就是冗余。 CrowdStrike事件清楚地提醒我們,無論供應商的聲譽如何,依賴單一的工具都會造成危險的單點故障,與多家供應商一起實施多層級的保護至關重要……

企業所有者不應僅僅將網路安全服務視為一項成本,而應該將其看作對公司未來的一項必要投資。

在網路安全層面,通俗來說,就像是給電腦裝上一套自動備胎,當原來的裝置出現故障,另一個「輪胎」可以自動補上,保持系統的正常運轉。從經濟角度考量,它意味著較高的成本投入,但在危急事件發生時,它可能於無形中消除一場災難。

「我一般會用次新版本或次次新版本的作業系統,穩定壓倒一切,不想當廠商的小白鼠。」 一位超算師這麽說。在大部份企業面臨藍屏危機時,一些使用30年前Windows老系統的企業躲過一劫,也從最極端的角度驗證了這種說法。

在技術融合日漸緊密,人們的工作生活愈發依賴互聯技術之時,如何在追求先進性的同時確保穩定:要便捷、經濟、還要允許適當的原始Plan Z。於靈活和笨拙間維持最起碼正常的運轉,是一個先進的數位化社會應該、並且迫切需要具備的能力。

參考資料:

【賽博&眾安科技:2022網路安全保險科技白皮書】

【安全技術與保險服務相結合的新興險種——網路安全保險有據可依】科技日報