制圖由騰訊元寶AI生成
微軟Windows系統大規模“藍屏”事件過去已近一周,但引發的風波仍未止息。在微軟方面把責任推給歐盟,聲稱其應為事故負責後,直接“罪魁禍首”之一CrowdStrike公司近日就此事釋出了詳細報告,解釋漏洞産生的具體原因,稱今後将加強針對更新的前置測試以確定其安全性。
南都·隐私護衛隊了解到,此次事件造成約850萬台計算機系統崩潰,外媒稱之為“史上最大規模IT故障”,大陸公共基礎服務幾乎未受到影響。此外,這場波及全球的系統崩潰事件還引發了各方對政府及企業高度依賴單一軟體或服務的擔憂。
為何CrowdStrike的一次更新,會造成全球這麼多系統崩潰?一些網際網路基礎設施為何如此“脆弱”?“藍屏”事件敲響了什麼安全警鐘?大範圍掌握全球計算機系統的“巨頭”微軟的權力是否應受到限制?
1 為何造成全球計算機系統崩潰?
“抱歉,酒店現在無法辦理入住。”
7月19日,身處美國波士頓的謝丹夏在辦理酒店入住時遭遇了難題。酒店的電腦螢幕上均呈現一片“藍海”,店員面對失靈的裝置束手無策,一衆顧客隻得無奈等待。同一時間,曼哈頓的哥倫比亞大學裡,顧榮輝的工作也被迫停止,原因是整個學校的計算機系統都中斷了。
電腦系統突然癱瘓的情況并不隻發生在這兩個地方,那一天,全球大約有850萬台微軟Windows裝置因故障無法使用。
該時段全球範圍内許多公共服務也“罷工”了。多國交通、金融、醫療、物流等行業服務被迫中斷,航班停飛、醫院停診、新聞停播、商店停售、證券交易癱瘓等亂象紛紛上演。微軟公司發言人回應稱出現大規模“藍屏”現象的原因是為微軟提供安全服務的第三方軟體平台CrowdStrike更新程式時存在代碼缺陷。CrowdStrike一下子成為關注焦點。
不久,CrowdStrike創始人兼CEO喬治·庫爾茨(George Kurtz)也出面安撫人們的情緒,稱此次事件不涉及網絡攻擊,已确定問題所在并部署修複措施。晚間,微軟方面再發文稱,根本問題已得到修複,正采取措施消除影響。
事情發生後,微軟和CrowdStrike的股價一路暴跌。相關消息上達美國白宮,庫爾茨也将應召前往國會作證。經過幾天搶修,7月21日,CrowdStrike方面發表聲明,稱還在加快推進裝置修複程序,目前大部分恢複正常。
南都·隐私護衛隊了解到,外媒将此次“藍屏”事件稱為“史上最大規模IT故障”。披露的事故原因讓不少人産生疑問——一個軟體更新漏洞“威力”為何如此之大,能讓數百萬台電腦通通“罷工”?
無糖資訊售前總監陳立果分析,單一的安全軟體漏洞影響如此之大的原因有兩點,底層權限與廣泛部署。
安全軟體需要檢測、發現、阻斷、清除惡意軟體,為了能對抗病毒,木馬甚至rootkit等惡意軟體,必然被賦予更大的權力,即作業系統的底層權限。擁有系統底層權限的安全軟體一旦出現漏洞,就可能導緻大面積系統“藍屏”等故障;不過,若沒有足夠的底層權限,其在面對棘手的惡意軟體時可能又無法有效對抗。此外,CrowdStrike的高市場占有率也是事故影響範圍大的前提。
CertiK聯合創始人、哥倫比亞大學計算機系教授顧榮輝告訴南都·隐私護衛隊,事件中影響到系統底層的重大故障,即使是微軟和CrowdStrike也無法通過遠端方式快速修複,必須依賴人工手動的方式逐一操作。而且即使漏洞被修複,之前已經完成更新的裝置仍會受到影響,是以需要的恢複時間更長。
資深資料法律師袁立志指出,一方面,目前Windows作業系統擁有極高的市場占有率,覆寫了交通、醫療、金融等重要行業;同時,網絡安全技術公司CrowdStrike在其細分領域占有率也很高,市場供給方集中。另一方面,無論企業還是個人使用者對微軟都有很高信任度。
“在這樣一個格局下,這種級别的事故出現就是大機率事件……軟體錯誤是比較常見的,隻不過正好發生在Windows系統,才會影響範圍如此廣泛。”袁立志說。
19日對很多國家“打勞工”而言是不同尋常的一天,大陸對這一情況知悉得卻有些“後知後覺”——中國公共基礎服務幾乎未受到影響,這是為何?
顧榮輝表示,由于CrowdStrike對華禁售,國内受影響的主要是外企、外企在華分支機構及合資企業,估計國内CrowdStrike軟體的裝機量在萬級,相關機關數在百級。
北京漢華飛天信安科技有限公司總經理彭根指出,中國公共基礎服務幾乎未受到影響,主要得益于大陸相關戰略政策,在數字化過程中堅持科技自主可控,實作作業系統國産化。
2 “藍屏”事件敲響了什麼安全警鐘?
數字社會下,計算機系統癱瘓帶來的影響是全方面的。19日當天,全球範圍内超過2000架次航班被取消,大量旅客滞留機場;醫院醫療裝置癱瘓,自動配藥櫃和安全系統失效;銀行服務中斷,連超市收銀機都無法收錢……國外主流社交媒體上鋪天蓋地都是相關吐槽,“打勞工”無奈留言“感謝微軟,提前放假!”
這時,特斯拉創始人、CEO埃隆·馬斯克代表衆人首先表達了不滿。20日,他發文譴責此次事件對汽車供應鍊造成了嚴重沖擊,并表示已經從所有系統中删除了CrowdStrike軟體。似乎是擔心語言不足以表達情緒,馬斯克還附上了一張“火燒機房”的AI生成圖檔。
24日,CrowdStrike終于給出一份交代,在其釋出的報告中解釋了事故的具體原因,并強調今後将加強針對更新的前置測試以確定其安全性。
“藍屏”事件無疑給全球科技企業都敲響了一記警鐘。遇到這類突發情況時,他們該怎麼應對?
在顧榮輝看來,面對突發的IT系統故障,良好的資料管理和IT治理實踐要求企業實施資料備援政策,即使用多個備份來存儲關鍵資料,以防原始資料丢失或損壞。同時,企業可能會使用災難恢複(DR)計劃確定在系統故障發生後能夠快速恢複服務。
南都·隐私護衛隊梳理發現,雖然這并非微軟系統首次出現大規模“當機”,但卻是近年來最嚴重的一次。據報道,今年1月,微軟雲服務發生全球性“當機”,影響範圍覆寫了從Outlook到Teams等一系列服務。5月,微軟的Bing、Copilot服務大規模中斷長達24小時。
既非極小機率事件,各方在防範這類系統性風險方面就應有所作為。
顧榮輝認為,從軟體供應商的角度來看,今後需明确并嚴格執行軟體更新的測試和驗證機制,確定其穩定性和安全性。在部署更新時,必須執行固定的更新範圍與更新節奏,確定即使出現任何問題,也能及時控制影響範圍與程度。
對企業而言,必須保證核心系統采用高可用架構、定期執行災難恢複和業務連續性計劃的測試,同時應盡量減少對單一供應商或技術的依賴。通過采用多元化的技術解決方案,降低因單一故障點而引發的系統性風險。
此外,企業還應定期針對基礎設施開展風險評估和安全審計,以便及時發現風險并進行修複。應建立一個強大而全面的監控系統,監測系統的健康程度與安全狀态,出現異常時能迅速響應。
袁立志表示,從ICT(資訊與通信技術)供應商角度看,既要做好自身的網絡安全管理,還要關注上遊、開發者、合作者的網絡安全風險,避免出現連鎖反應而被牽連。從企業、使用者的角度看,過度集中依賴某些基礎軟體可能會造成非常被動的局面。
不過,他強調,在某些領域,由于能提供相同級别ICT産品或服務的供應商并不多,使用者的選擇餘地不大,除了平時做好防護工作外,發生安全事件時及時采取應急措施顯得格外重要,有利于将損失降到最小。
比如,部署備用系統,以便緊急時接管或切換;做好相關資料備份,防止資料丢失洩露;完善應急響應機制,做好類似各種極端場景的應急預案,開展故障應急演習等等。
供應鍊國産化使大陸免受此次事故傷害。不過,綠盟科技副總工程師林濤指出,受各種因素影響,目前大陸資訊系統中仍有許多非國産的應用軟體甚至基礎軟體,對于短期内無法替換的軟體,還需加強自主化的安全營運保障,同時加快重要軟體産品的國産化研發和部署應用。
3 巨頭微軟是否觸及反壟斷?
幾行代碼錯誤,就能引發一場全球範圍的科技“海嘯”。除了網絡安全責任,有關微軟壟斷地位的争議近日也甚嚣塵上。
事件發生後,美國聯邦貿易委員會(FTC)主席莉娜·汗(Lina Khan)發文稱,該事件揭示了集中化如何孕育出脆弱的系統。NextGen Competition的執行董事喬治·拉基斯(George Rakis)也指出事故根源離不開軟體壟斷。
北京師範大學法學院博士生導師、中國網際網路協會研究中心副主任吳沈括指出,此次事件展現出目前數字社會對現代資訊技術的依賴性,以及全球技術基礎設施的脆弱性。
顧榮輝表示,必須警惕對單一供應商軟體或服務的依賴風險。在選擇安全服務時,應采取多元化政策,以增強系統的抗風險能力。
微軟對全球計算機系統的掌控程度如此之高,是否觸發了反壟斷問題?其權力應受到合理限制嗎?
“微軟系統在全球作業系統軟體中占據龐大的市場佔有率,是以一旦出現問題,就會對社會經濟造成非常廣泛的負面影響。從防範風險的角度來說,應該鼓勵發展、采用多元化的作業系統以及盡量倡導開源系統。同時,這次事件敲響了一個警鐘,不論某個平台如何強大,都必然有一些不可預測的潛在風險。”清華大學社科學院經濟所長聘副教授謝丹夏表示。
在他看來,平台進行反壟斷監管、避免經濟體中出現在某一市場中“赢者通吃”的大平台,是緩沖潛在風險的重要方式,且不同平台對網絡效應的依賴程度以及對外部沖擊的敏感性也各異。是以,在實施平台壟斷監管時,需要根據不同類别平台所對應的不同風險特征,實施分類監管。
對應到此次事件,謝丹夏認為對于金融服務類平台、計算應用類平台等容易引發頻次低但危害強度大的“黑天鵝”風險的行業,應該更多地考慮平台集中度增加帶來的效率提升與風險加劇二者間的權衡,可鼓勵培育多平台的市場結構,以分散可能産生的風險。
無糖資訊售前總監陳立果預測,事故造成的經濟損失可能高達數十億美元。誰該為“藍屏”事故買單?23日,微軟“甩鍋”給了歐盟,稱其應為此次事故負責。
原來,微軟與歐盟曾在2009年達成一項協定,協定要求微軟允許其他供應商在Windows作業系統上安裝第三方安全軟體,微軟認為此舉降低了系統安全性,導緻其無法在Crowdstrike的更新出現問題時采取安全措施。
對此,謝丹夏表示,微軟和歐盟分别代表了一種短期和長期視角。正如将一盆長期在溫室裡生長的植物移到室外,它一時間很難經受得住外界風霜和病毒的侵襲,但随着這盆植物适應了外部環境,反而會變得更加強壯。“長期來看,一個經受諸多考驗的、透明的開源系統更為穩健和安全。”
南開大學競争法研究中心主任,法學院副院長、教授陳兵認為,單從此次微軟“藍屏”事件來看,并不涉及反壟斷問題。
陳兵指出,在相關領域内,很難找到與微軟同一級别的供應商,更遑論替代微軟。而且微軟作為全球普及率最高的作業系統之一,其對網絡安全的重視程度和實施水準幾乎也是最高的。是以,針對此類事件,比較合适且務實的解決方案是由相關部門加強監管,将微軟的行為限制在一個可控的範圍之内,給予微軟一定的整改時間和機會,要求其提供相應解決方案等。
經此一役,CrowdStrike可謂在全球“出圈”了,今後面臨的還有海量訴訟和索賠要求。24日消息,馬來西亞數字部長哥賓星·迪奧(Gobind Singh Deo)表示,已向微軟、CrowdStrike提出要求,對全球系統“當機”期間遭受損失的公司作出賠償。
“如果你是CrowdStrike的律師,就别指望過好剩下的夏天了。”Wedbush證券分析師丹·艾夫斯(Dan Ives)說道。
采寫:南都記者 樊文揚 黃莉玲 李玲