天天看點

西安一碼通又崩了,誰之過?誰該負責?

1月4日9時,西安一碼通再次癱瘓。對此,西安大資料管理局回應,一碼通連結通路量太大,正在采取限流措施,後續逐漸開放。疫情期間,健康碼是必不可少的出行“神器”,掃一掃便知身份資訊和健康狀況,大幅提高了核驗工作的效率和精準度,西安一碼通的多次崩潰對人們的生産和生活帶來了極大的不便。

那到底西安一碼通再次崩潰是誰之過呢?本次西安一碼通崩潰的原因尚不明确,但是可從之前的系統崩潰中見到端倪。

12月20日早7時40分左右,西安“一碼通”使用者通路量激增,每秒通路量達到以往峰值的10倍以上,造成網絡擁塞,緻使包括“一碼通”在内的部分應用系統無法正常使用。西安市大資料局原局長劉軍提出了“非必要不亮碼”的觀點:在全員核酸檢測的特殊時期,為減輕系統壓力,建議廣大市民非必要不展碼、亮碼,在出現系統卡頓時,請耐心等待,盡量避免反複重新整理。

很明顯,這一說法難以服衆。到底西安一碼通為何崩潰?對此,10餘位來自騰訊、華為、中興、ICT資料分析的專家從前端、後端、測試方面進行了主要原因分析。

1、限流問題:市民在長時間無法刷出健康碼的情況下,多次退出重新整理重試,新的流量到達伺服器,導緻伺服器壓力變大、承受負載增加,說明西安“一碼通”系統沒有做好限流措施。

2、伺服器問題:伺服器是有峰值限制的,不可能承受無上限的并發能力。而造成伺服器癱瘓的原因就是在同一段時間内,通路人數多,造成高流量的突進,超出了伺服器的承受範圍。

3、架構問題:西安“一碼通”功能影響“核酸檢測”服務,說明子產品間從界面到資料調用互相影響,可能不是微服務架構。

4、性能過載:典型的性能過載場景,不論内部根因是資料庫瓶頸點,還是網絡連結數瓶頸點等等,外因都是因為過載導緻。

5、場景問題:大資料查詢下載下傳的時候,一個線程占用資源過多,導緻其他服務等待乃至個人電子碼裡面核酸的資訊不顯示了。是以估計西安“一碼通”是個門戶,資料甚至“卡片”都是從各子系統引過來的伺服器挂死當機的情況;

6、設計漏洞:沒有考慮高流量高負載的情況,導緻測試不充分;産品設計未考慮千萬級的并發通路,傳遞前未進行同等級的壓力測試。

7、壓力測試:在市民長時間無法看到健康碼的情況下,多次退出重新整理重試,新的流量到達伺服器,導緻伺服器壓力變大、承受負載增加,說明壓力測試不夠。

據技術專家表示,前期西安電信對平台的壓力測試不足,是造成本次服務癱瘓的主要原因。

壓力測試不足的問題真的難以解決嗎?相比之下,武漢的防疫工作就比較經得起考驗了。武漢經曆3次重大疫情,每次應對疫情表現出來的“速度、穩定、有序”,與西安防疫形成了鮮明的對比。就拿8月份的突發疫情來說,面對超5000萬次核酸查詢,武漢仍順利地打赢了疫情防控阻擊戰。

那麼參與西安一碼通建設的公司有誰,誰又應該對此負責呢?相關網絡資料顯示,西安市個人電子識别碼(即西安“一碼通”)由西安市大資料資源管理局牽頭,中國電信西安分公司開發部署,于2020年2月25日在西安全市範圍内推廣使用。西安市大資料資源管理局官網顯示,參與西安“一碼通”安全工作的還有東軟、阿裡雲、啟明星辰、安恒等多家公司。

據網絡資料顯示,當初移動電信聯通三家競标西安一碼通,西安電信中标,然後把業務分包給三家公司——浙江安恒、美林科技以及另外一家公司。傳聞當時負責西安一碼通開發運維的從業人員,陷入了“沒有綠碼就不能上班,不上班就無法修複軟體”這一死循環段子的主角,這名程式員就是美林資料的從業人員。

美林資料畢竟隻負責資料,系統崩潰的原因很多。疑似美林副總裁在朋友圈回應了關于西安一碼通的說明:美林資料參與的是賦碼算法,電信和東軟負責營運。本次系統崩潰與我公司無關。

關于一碼通出問題的原因的猜測,林林總總。歸根結底,技術保障要做足。

據工信部官網1月4日消息,2021年12月30日至31日,工業和資訊化部總工程師韓夏到陝西省通信管理局開展疫情防控工作調研。韓夏來到西安“一碼通”工作專班,了解核酸采樣系統應急處置措施,要求系統再優化,細節再完善,確定不出現擁塞當機現象。

1月5日淩晨,西安市委組織部釋出幹部任免資訊,西安市大資料資源管理局局長劉軍因履職不力,被停職檢查。劉鑫任市大資料資源管理局黨組成員,為副局長人選(主持工作)。

希望在找到事故原因、加強技術保障後,西安一碼通能夠盡快恢複工作,為人民群衆的生産生活築牢安全防線,不要再在關鍵時刻掉鍊子。

西安一碼通又崩了,誰之過?誰該負責?

2022ICT行業趨勢年會

通信圈2022開年盛會

等您來“同框”

西安一碼通又崩了,誰之過?誰該負責?

2021年度中國ICT産業龍虎榜

暨優秀解決方案

重磅發榜!

作者:程琳琳

責編/版式:範範

稽核:申晴

監制:劉啟誠

我就知道你“在看”

繼續閱讀