天天看點

基于安全大資料應用平台的鐵路安全綜合管理系統的實作

作者:暢藩軟體

近年來,随着鐵路資訊技術的快速發展,将大資料等新技術應用于鐵路安全綜合管理,輔助提升安全管理效率,對于保障鐵路運輸安全具有積極的意義。

鐵路安全大資料分析是智能鐵路、運輸安全、人工智能、大資料等領域交叉研究内容[1-3]。康高亮等人[4]提出中國高速鐵路安全保障體系架構;佘振國等人[5]研究提出鐵路安全風險預警資訊系統設計方案;周進[6]研究鐵路運輸事故緻因及安全風險分析方法;楊連報[7]研究鐵路事故故障文本大資料分析的關鍵技術及應用;黃英華[8]提出利用大資料技術推進安全生産雙重預防機制建設;馬小甯[9]全面總結鐵路大資料應用實踐并對今後發展進行展望。以上學者主要針對鐵路運輸安全體系架構、頂層設計或者安全管理機制開展研究,利用大資料分析技術開展安全管理應用系統開發的研究相對較少。

本文以鐵路局集團公司的鐵路安全綜合管理系統(簡稱:系統)作為安全大資料應用平台的研究執行個體,針對鐵路局集團公司安全監督管理的業務需求,提出系統方案設計,後續将以此為藍圖推進系統開發。

1. 系統架構

1.1 總體架構

系統依托鐵路局集團公司安全大資料應用平台,以安全資料彙集與治理為基礎,內建安監、人事、機務、工務、電務、供電、車輛等專業的安全主題資料,利用大資料技術對結構化、非結構化的海量業務資料開展分析;在此基礎上,引入AI算法開展安全趨勢研判研究,幫助安全管理業務人員及時發現和消除安全隐患,以采取有效措施防止安全事故的發生。系統總體架構如圖1所示。

基于安全大資料應用平台的鐵路安全綜合管理系統的實作

圖 1 鐵路安全綜合管理系統總體架構

(1)既有系統

以鐵路局集團公司各專業既有系統中安全管理主題相關資料作為基礎資料源,為鐵路安全綜合管理系統的建構提供資料支援。

(2)平台層

通過鐵路局集團公司安全大資料應用平台,将現有安全管理主題相關資料源接入,進行清洗和轉換,剔除備援和無效資料;重新梳理業務應用資料的血緣關系,将原先分散在多個獨立應用系統中的安全管理主題相關資料以新的結構集中存儲在大資料平台中,建立清晰的資料目錄,為鐵路安全綜合管理系統的研發提供有利條件。

(3)應用層

應用層主要包括安全生産關鍵名額分析、安全風險智能分析及安全态勢感覺分析3項功能,基于大資料統計分析功能,結合人工智能算法,分析資料中隐含的态勢和規律,輔助判别安全趨勢變化。

(4)使用者層

使用者層涵蓋鐵路局集團公司決策層與各業務部門及站段,為使用者提供按其職責權限定制開發的安全綜合管理資料分析服務;根據各類使用者不同職責,配置設定相應的系統功能通路權限。

1.2 技術架構

系統技術架構基于鐵路局集團公司安全大資料應用平台,邏輯上可劃分為資料采集層、資料服務層、資料通路層、資料應用層及資料展現層5個層次,如圖2所示。

基于安全大資料應用平台的鐵路安全綜合管理系統的實作

圖 2 鐵路安全綜合管理系統技術架構

(1)資料采集層将各類安全管理主題相關資料通過标準資料接口,先抽取并存儲到中間資料庫中,對這些資料進行結構梳理,并建立資料登記的原始記錄。

(2)資料服務層提供結構化和非結構化資料存儲服務;其中,結構化資料存儲管理主要以資料倉庫為主,為結構化資料提供标準SQL資料定義、操縱、查詢與控制服務;非結構化資料庫由HBase、HDFS等組成,對海量的非結構化資料提供存儲服務, 并完成分布式計算。

(3)資料通路層采用Hibernate完成對象關系型資料庫映射,與外部系統的資料接口一般采用RESTful方式實作。

(4)資料應用層是系統開發的基本架構集合,主要采用SpringMVC等架構,完成業務邏輯的實作。

(5)資料展現層是系統面向使用者的前端展示媒介,采用Bootstrap架構實作頁面響應式渲染,通過Ajax異步請求與伺服器實作資料互動,以可視化方式将分析結果資料動态展現給使用者 。

1.3 資料接口

系統資料接口主要包括2類:實時資料接口與非實時資料接口。其中,實時資料接口又分為高可靠實時共享接口與高性能實時共享接口;前者采用分布式隊列 Kafka 技術,能夠保證資料不丢失,适用于響應速度适中、資料準确性要求高的安全業務場景;後者采用 WebSocket Stomp 協定共享,高效但不能保證資料不丢失,适用于并發請求較多且實時性要求較高的業務場景。對于非實時資料接口,系統采用RESTful 方式實作資料共享,接口響應間隔由系統輪循間隔決定,适用于大資料量分析、且實時性要求不高的業務場景。

2. 功能設計

2.1 事故及故障綜合分析

依托鐵路局集團公司安全大資料應用平台,對原先分散在多個系統中的安全管理主題相關資料進行梳理、整合,利用記憶體計算、即席查詢等技術,為不同層級安全管理業務人員提供自助式分析服務。

2.1.1 安全即席分析

(1)互動式分析:提供可視化分析界面,集中展示安全管理主題相關資料,揭示每一項資料的特征和分布規律,檢視資料是否滿足正态分布及帕累托分布;調整細分的目标資料集合,可切換分析名額、次元和圖形樣式;探查資料中是否存在異常情況,可定位發生異常的目标資料,生成直覺的資料診斷報告。

(2)智能檢索:梳理海量的安全管理主題相關資料,為資料建立便于統計、分析的各種索引。使用者輸入關鍵字後,系統可主動判斷使用者意圖,根據索引自動選擇資料對象,切分使用者關注的詳細資料集合;在圖形界面上展現對應的資料分析圖表,以便于開展互動式探查分析。

(3)啟發式分析:當使用者進行資料分析時,系統首先呈現目标資料集合的分布規律,以啟發業務人員設定合适的、有針對性的過濾條件,輔助其發掘安全資料中隐含的規律。

2.1.2 安全風險智能分析

(1)安全風險構成及趨勢分析:按照鐵路局集團公司、業務部門、站段、工廠中的房間等4個層級,進行安全風險總量的構成分析,發現與預期不符的構成部分,對其展開趨勢研判與對比,診斷安全風險及管控異常情況。

(2)安全風險分級管控分析:按照重大、較大、一般、較低4個風險級别,分析鐵路局集團公司、業務部門、站段、工廠中的房間安全風險總量在各個風險級别上的分布情況,發現與預期不符的情況,避免重大安全風險出現漏檢或少檢。

2.1.3 安全态勢感覺分析

(1)異常情況分析:綜合評估鐵路局集團公司、業務部門、站段、工廠中的房間的安全風險、隐患、通知書、故障、事故資料,并根據資料分布規律及趨勢變化,分析安全管理異常狀況。

(2)态勢感覺分析:通過對事故故障、安全問題、安全資訊、檢查寫實記錄、安全風險管控及隐患排查治理等資料研究,實作對各專業安全态勢感覺。

2.1.4 安全生産關鍵名額分析

彙集安全風險過程控制管理系統和安全監督管理資訊系統的相關資料,分析并揭示安全風險控制情況、安全隐患排查情況、安全投入情況、網絡安全情況、高鐵和旅客列車安全情況、從業人員傷亡情況、責任鐵路交通事故情況、責任行車裝置故障情況、安全紅線觸犯情況等安全生産關鍵名額。

2.1.5 事故故障溯源分析

(1)風險自動識别:比對已建立的安全風險資料模型庫,實作風險的自動識别與告警。

(2)風險等級判定:判斷已發生危險事件的危險等級,對比修正現有風險庫。

(3)危險事件推演:對已發生的危險事件進行溯源分析,建立危險事件緻因關聯資料庫,自動對比鐵路局集團公司安全大資料比對情況,對存在同類危險機率可能性進行分析判斷,提出安全管理幹預建議。

2.2 安全風險管控與隐患排查治理分析

2.2.1 安全風險分析

按照風險項目、風險項點、風險類别、風險危害程度,對鐵路局集團公司級、站段級風險點進行歸類和統計,對系統識别出的安全重大風險、較大風險進行自動預警。

2.2.2 安全隐患分析

按照隐患的類别和等級,對發現的安全隐患進行歸類和統計,提供隐患曆史記錄溯源;基于安全管理主題相關資料,分析安全風險與安全隐患之間關系,安全隐患與事故/故障之間關系,以及安全隐患與安全裝置、安全人員之間關系;對已發現的安全隐患進行處理并銷号,實作安全隐患的閉環管理,防範事故/故障的發生。

2.3 安全綜合管理分析

基于各類安全管理主題業務資料,開展關聯分析,挖掘安全隐患的主要來源、事故/故障的緻因,以及可能導緻的關聯的事故故障類别。同時,建立安全“風險—隐患—事故故障”演變規律模型,分析安全裝置檢測、監測、報警資料與隐患、事故/故障的關聯關系,建立風險、隐患、事故/故障、安全監督、裝置狀态、人員、外部環境的知識圖譜,輔助安全管理人員實作及時、精準的監督檢查。

3. 關鍵技術

3.1 文本分析技術

系統運用文本分析技術,提取安全事故/故障報告中蘊含的非結構化安全管理主題相關資料,經處理後形成集檢索、提取、歸類、轉化等功能于一體的安全管理資料文本知識庫,基于該文本知識庫開展面向風險、隐患、安全事故/故障的關聯分析,挖掘安全事件的發展規律。

自然語言處理(NLP,Natural Language Processing)的應用主要有機器翻譯、文本摘要、文本情感分析、知識圖譜、智能問答等[9]。鑒于鐵路行業語料的獨特性,鐵路自然語言處理(文本分析)是一種有别于通用自然語言處理分析的垂直行業應用類型,主要應用全文檢索、命名實體識别、不平衡資料分類、協同過濾、知識圖譜、時間序列、深度學習等技術。此外,從時空、關聯、行為等角度,建立面向鐵路安全業務的AI模型,提供業務應用和人工智能分析模型的接口服務調用。

面向安全綜合管理的文本分析技術通過采集與安全事故和故障相關的文本資料,建立故障庫、事故庫和事故/故障報告庫,實作事故/故障追蹤報告的大資料分布式存儲和全文檢索。同時,應用深度學習模型、命名實體識别等大資料和文本挖掘等前沿技術和工具,從非結構化的事故/故障文本資料中自動提取出事故/故障名稱、地點、時間、原因、整治措施等關鍵資訊,将非結構化的事故/故障文本資料轉換為結構化資料進行存儲,建立鐵路局集團公司曆史事故/故障庫,應用文本分析技術對重點事故/故障、多發事故/故障區域等展開分析。

3.2 資料治理技術

系統融合資料治理技術,依托鐵路局集團公司安全大資料應用平台的中繼資料管理、主資料管理、資料品質管理等子產品,實作對鐵路局集團公司安全管理主題相關資料的全生命周期管理,提供血緣分析、影響分析、關聯分析、資料品質報告等功能。

鐵路局集團公司安全大資料應用平台可自動同步主資料平台中的安全管理主題相關資料,依據主資料與資料稽核規則,按需建立不同的稽核模型,對接入平台的安全管理主題相關資料進行品質稽核。該平台采用批處理與流處理相結合的方式,對各類安全管理主題相關資料進行分析處理,并生成資料品質報告;采用Hadoop中MapReduce計算架構,利用基于Spark生态技術的批處理與流處理、基于Flink生态技術的批處理與流處理以及基于Storm技術的流處理,将瞬間計算轉換為平穩的流式實時計算,以充分利用伺服器的空閑時間,減輕伺服器瞬時壓力,提升鐵路安全管理主題資料治理的實時性。

4. 結束語

以鐵路安全綜合管理系統作為北京局集團公司安全大資料應用的研究執行個體,從系統架構、功能設計、關鍵技術3方面介紹系統設計方案。作為鐵路安全大資料應用的示範項目,該系統将為鐵路安全管理人員提供便捷、靈活、客觀的輔助決策支援工具,旨在為鐵路安全綜合管理賦能。

目前,使用者與研發機關已利用Demo程式,就系統設計方案充分溝通、論證和确認,下一步将全面啟動開發工作。

繼續閱讀