天天看點

網絡安全與執法專業引入大資料相關課程體系的研究

本文就目前環境下,網絡安全與執法專業引入大資料相關課程體系的必要性進行了論述。結合該專業自身特性,對拟引入的大資料相關專業課程提出了選擇建議,同時對拟引入的課程教學内容和其在網絡安全與執法專業的業務應用方向進行了闡述。

引言

随着網際網路的高速發展,資訊技術這把雙刃劍為我國公安部門提出了新的問題和發展方向。一方面,各種網絡犯罪、網絡突發輿情、網絡洩密等危害國家安全和社會穩定的情況對網絡安全與執法提出了更高要求;另一方面,友善快捷的網絡生态又為偵查線索搜集,通緝追逃等傳統手段提供了新的解決思路和方法。為此,我國部分公安院校陸續設立了網絡安全與執法專業。

該專業的培養目标,主要是為公安機關培養網絡安全與執法人才,要求其既懂技術,又會管理和執法。在其專業課程設定上,具有顯著的公安特色,如法律、現場勘察,計算機驗證等,同時,在技術層面上,又緊貼計算機及網絡相關專業。要求其學員具備計算機科學與技術、資訊安全學科的基本理論和知識,熟悉網絡安全與執法工作的相關法律法規知識,具備網上發現和處置、網上偵查和網上違法違規行為防範和控制的能力,能勝任網絡安全與執法方面的實際業務工作,有能力組織實施網絡資訊安全保護,具備搜集網際網路情報資訊的手段,有能力完成網絡監管,以及對重要系統的網絡安全監督。

目前,各院校在該專業的技術領域計算機技術方向上,主要偏重于計算機基礎、網絡技術、網絡安全技術等,而大資料技術的發展,為其相關專業課程的引入提出了新的需求。

大資料相關專業課程的設定必要性

傳統的偵查模式基本上是從案到人的偵查模式,而面對現代高智能犯罪、恐怖活動犯罪以及突發性群體事件,傳統的偵查模式不能在事發前就對其進行預防,及時地發現犯罪迹象,對其進行控制和打擊,以避免事态惡化。而現代偵查模式能及早地發現犯罪迹象,進而主動進行偵查,控制局面。大資料技術就是現代偵查模式中的一種,它的引入,為現代偵查帶來了新的機遇,資訊資料庫的建立便于全面掌控犯罪資訊,大資料技術中的資料分析和智能檢索技術提高了偵查效率,偵查機關也可以利用資料挖掘和預測來進行犯罪預防和控制。世界範圍内,運用大量資料進行犯罪偵查和控制,始于1994年紐約市的警察部門啟用compstat系統,該系統通過對資料統計報告的各種比較,進行犯罪預防,确定警力資源配置設定和打擊對策。

大資料(big data),指無法在一定時間範圍内用正常軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資産。大資料技術的意義不在于掌握龐大的資料資訊,而在于對這些含有意義的資料進行專業化處理。換而言之,如果把大資料看作一種手段,那麼這種手段實作預期目标的的關鍵,在于提高對資料的“加工能力”,通過“加工”實作資料的“增值”。 大資料在西方廣泛應用于商業營銷、群體事件預測、疾控、金融投資分析、精細化教育投放等,也運用于社會監控和預測、治安管理、恐怖主義打擊等等方面。

随着大資料技術的發展,部分國家開始建立大資料驅動的犯罪偵查和控制體系,該體系利用大資料分析曆史案件、發現犯罪趨勢以及犯罪模式;通過挖掘城市和社交網絡資料,進行犯罪預測;利用大資料優化警力資源配置設定等。總體來說,利用大資料技術,提升犯罪偵查和控制能力是未來的發展方向。

綜上所述,在網絡安全與執法專業,開設大資料相關課程,是有其必要性和緊迫性的。

大資料方向專業課程體系建設

雖然在網絡安全與執法專業的教學中,引入大資料相關專業課程是有必要性和緊迫性的,但是要全面引入大資料的專業課程,明顯是不現實的,同時,也并無必要。在此,筆者根據網絡安全與執法專業的專業特性和需求,結合大資料相關技術的特點和應用方向,綜合分析研究,推薦選擇以下幾門課程作為網絡安全與執法專業大資料方向的專業課程,形成網絡安全與執法專業大資料方向的專業課程體系。資料挖掘基礎(專業基礎課);多元統計分析(專業課);流式資料處理(專業課);大資料方向專業課程教學内容。

3.1 資料挖掘基礎

資料挖掘是一門新興的交叉性學科,是在資訊技術領域迅速興起的計算機技術。資料挖掘技術面向應用,在很多重要的領域,資料挖掘都發揮着積極的作用,是大資料應用的主要手段之一。在犯罪偵查、線索搜集、網絡監管、輿情監控等各個方向上,都有重要的應用。

資料挖掘基礎全面介紹資料挖掘的原理、方法和算法。主要内容包括資料挖掘的基本概念、資料挖掘算法的資料類型、輸入和輸出、決策樹、資料挖掘的預處理和後處理、關聯規則挖掘、分類和回歸算法、支援向量機、聚類分析及多元資料可視化。

該課程作為專業基礎課,通過該課程的學習,使學員了解資料挖掘技術的整體概貌,了解資料挖掘技術的主要應用及目前的研究熱點問題,了解資料挖掘技術的發展方向,掌握最基本的概念、算法原理和技術方法。

3.2 多元統計分析

多元統計分析是從經典統計學中發展起來的一個分支,是一種綜合分析方法,它能夠在多個對象和多個名額互相關聯的情況下分析它們的統計規律,是數理統計學中的一個重要的分支學科。主要内容包括多元正态分布及其抽樣分布、多元正态總體的均值向量和協方差陣的假設檢驗、多元方差分析、直線回歸與相關、多元線性回歸與相關(Ⅰ)和(Ⅱ)、主成分分析與因子分析、判别分析與聚類分析、shannon資訊量及其應用。簡稱多元分析。

多元統計可以處理以下幾類實際問題。

多重回歸分析,簡稱回歸分析。其特點是同時處理多個因變量。回歸系數和常數的計算公式與通常的情況相仿,隻是由于因變量不止一個,原來的每個回歸系數在此都成為一個向量。該分析可以通過多個因變量的處理,統計分析某一因變量的變化趨勢。

判别分析,由 k個不同總體的樣本來構造判别函數,利用它來決定新的未知類别的樣品屬于哪一類,這是判别分析所處理的問題。它在網絡安全與執法、偵察各方面都有廣泛的應用。

聚類分析,又稱數值分類。聚類分析和判别分析的差別在于,判别分析是已知有多少類和樣本來自哪一類,需要判别新抽取的樣本是來自哪一類;而聚類分析則既不知有幾類,也不知樣本中每一個來自哪一類。

主成分分析,又稱主分量分析,是将多個變量通過線性變換以選出較少個數重要變量的一種方法。在根據樣本進行主成分分析時又可分為r型分析與q型分析。前者是用樣本協差陣(或相關陣)的特征向量作為線性函數的系數來求主成分;後者是由樣品之間的内積組成的内積陣來進行類似的處理,其目的是尋找出有代表性的“典型”樣品,這種方法在地質結構的分析中常使用。

其他還有對應分析、因子分析、對應相關分析等。

該課程作為專業課,通過該課程的學習,掌握其各種分析方法,在網絡輿情監控、犯罪偵查、線索搜集、犯罪預防、群體事件輿情事件防控等方面,都有較為廣泛的應用。

3.3 流式資料處理

流式資料處理,指針對流式資料的一種分布式、高可用、低延遲、具有自身容錯性的實時計算技術,它是根據一組規則來動作的工具,通過提取和分析來自各種分布式系統的資訊,來解決監控和管理的各種問題。

該課程作為專業課設定,其主要教學内容包括實時資料采集,實時資料處理,實時查詢服務,目前主流流式資料處理産品簡要教學等内容。

流式資料處理技術主要針對資料時效性要求高,原始資料量大,資料量變化迅速,業務生命周期短的大資料應用。其應用特性和網絡安全與執法專業所面對的資料特性具有高度契合性,可廣泛應用于犯罪偵查,實時線索采集,實時追蹤,網絡輿情監管,突發事件防控,治安管理,警力排程,網絡資訊采集監管等各個方面。

結語

對于網絡安全與執法專業來說,大資料相關專業體系的引入,對于偵查體系的提升,業務能力的加強,監管手段的豐富,覆寫面積的加大等各個方面來說,都有其重要的現實意義和緊迫性。同時,對于學員的個人能力提升和知識廣度的擴大,增大學員的就業面,也有其實際作用。但是,目前現狀下,大資料相關專業課程也存在人才儲備不足,師資力量薄弱的問題。相關院校可在條件成熟時,結合自身條件,适時引入大資料相關專業課程體系,建設有特色的網絡安全與執法專業。

本文轉自d1net(轉載)