天天看點

台北桃園機場計算機為何會當機36小時?!

 根據相關媒體報導,問題起因于第二航站的境管計算機的磁盤陣列系統中有三塊硬碟和一片主機闆在本月3日發生故障,标得移民署計算機維護案的神通計算機于本周一(5日)清晨更換其中一塊硬碟,并至第一航站仍正常運作的境管計算機中,抓取與彙入入出境資料的時候,因不明原因導緻互為備份的第一航站與第二航站的境管計算機先後當機,計算機當機後,除高雄港與高雄小港機場以外的機場港口皆受影響,全得以人工操作的方式檢核入出境旅客資料,曆經36小時搶修後,境管計算機已恢複大部分的入出境檢核作業。

    姑且先不談有無列管人士趁亂(境管計算機當機36小時)離境,但該事件确實透露出桃園機場在資訊管理上的一些疏失。

    第一,境管計算機的備份機制不夠完善。事發之際,我曾去電桃園機場資訊室詢問導緻入出境計算機當機的真實原因是人為疏失、黑客入侵或機器損害,以及桃園機場有沒有為入出境計算機架設異地備份機制,無奈,無論我用盡各種方式(包括變聲、換個方式問問題等),對方不是拒答就是給我軟釘子。

    但就我動筆撰寫該篇文章前所搜集到的一手與二手資料來看,移民署對于用來管理記載1981年以後約40億筆入出境旅客資料的境管計算機的備份管理機制似乎不大嚴謹。理由是,早在本次事件發生前,境管計算機即曾因為系統過于老舊而出現多次當機事件,但因維修人員都能在十幾分鐘内搶修完畢,導緻主事者從未正視國境大門會因境管計算機過于老舊不易維修而洞開36小時等窘境發生、更不用說台灣國際機場的專業形象很可能毀于老舊的境管計算機系統。

    再者,某不願具名的業界人士表示,由于第一航站與第二航站的境管計算機系統極老舊,即便移民署曾有打算在異地為境管計算機系統重建備份機制,但在考慮技術門坎過高、得投入龐大資金與資源等因素後,便将該計劃往後延宕,是以,當境管計算機因不明原因先後當機後,移民署除忙搶修,以及改以人工操作取代計算機作業外,别無他法。

    資訊服務管理機制不夠嚴謹

    我想,經過這次的風波,移民署與桃園機場等主事機關應該會更謹慎的重新規範資訊服務作業模式。

    第二,資訊服務管理機制不夠嚴謹。促發桃園機場境管計算機系統當機的主要原因衆說紛纭,不過,無論真實原因是硬體損毀或者是人為疏失,都建議移民署重新檢讨與拟定更嚴謹與完善的資訊服務管理(it service management;itsm)機制,尤其,桃園機場裡的軟硬體資訊系統架構皆極龐大且複雜,為確定相關人員能在異常狀況發生前、或者是問題發生後,以最短的時間内找出問題症結點、解決問題,相關人員是否有一份最新、最詳細的機場資訊服務标準作業程式供參考,極重要。

    從這次的境管計算機當機長達36小時一事來看,桃園機場手頭似乎沒有最新且實時的資訊服務标準作業程式供參考。否則,移民署國際事務大隊與資訊室等主事單應該能在第一時間對外說明導緻境管計算機當機的症結點為何、境管計算機不會在移民署對外表示6小時即可完修卻拖至36小時後才恢複正常運作,當然,标得移民署2009年計算機維修案的神通計算機也不應該會對媒體表示,歡迎去年得标公司─大同世界科技一起加入搶修等。

    讓我們在換一個角度思考,即使移民署有與簽約廠商簽定系統故障後6小時即得修複的服務層級協定(sla)、簽約廠商也向移民署提出可證明其專業服務能力的證照,如政府标案必備證照一cmmi等,但若移民署本身沒有一套完善的資訊服務管理機制,那麼,如何稽核外部廠商的服務能力确實符合移民署預期?位居第一線的移民署資訊人員是否能在最短時間解決廠商也無力解決的問題?如何確定桃園機場的關鍵資訊系統可以7 x 24的正常維運?

    事實上,除無完善的異地備份機制,以及欠缺嚴謹的資訊服務管理機制外,該事件亦突顯出移民署在風險管理與危機處理等構面的能力待改善,不過,鑒于事發至今才第三天,再加上内政部長廖了以也向媒體保證在調查出确切原因後會給大家一個交代,是以,本文僅探讨該事件可能涉及的資訊管理問題等議題,至于後續議題,例如境管計算機當機後所可能引發的資訊安全危機等,歡迎大家一起讨論。

作者:zdnet台北記者蔡宜秀

來源:51cto