當可視化遇上“犯罪克星”
從2020年11月2日開始記錄我讀論文後的一些總結,希望可以見證自己的成長
文章目錄
- 當可視化遇上“犯罪克星”
- 前言
- 一、本文講了什麼?
- 二、為何需要這麼一套可視化分析系統?
- 三、有何創新點?
-
- 1.算法應用的創新
- 2.更加細粒度的分析
- 總結
前言
本文是我讀完IEEE VIS的論文《CrimAnalyzer: Understanding Crime Patterns in São Paulo》後的一些總結
提示:以下是本篇文章正文内容,下面案例可供參考
一、本文講了什麼?
本文将可視化技術應用于城市犯罪模式分析,設計了一套名為**“CrimAnalyzer”**的可視化分析系統,首先應用于聖保羅這一犯罪率極高的大城市,該系統可以靈活的分析不同地獄的犯罪模式(何種犯罪模式最常見、哪種犯罪模式正在增長、犯罪行為集中在那些區域),解釋了犯罪形式随時間的演變,提供派警、預防行為的指導,輔助警局。

二、為何需要這麼一套可視化分析系統?
欠發達國家大型城市一直受安全問題困擾,聖保羅就是其中的典範。可視化作為一種資料分析的工具,已經在城市犯罪資料領域得到了應用,如Crimemapping,但他們往往局限于單純的統計犯罪事件以及數量,難以進行可視推理。
三、有何創新點?
1.算法應用的創新
采用了NMF(非負矩陣分解)來進行犯罪熱點的偵查,相較于傳統的Getis-Ord General G(高/低聚類算法)而言,速度更快,效果更好。
(1)NMF應用介紹:
圖a為某一區域的25個站點并标記了四個站點,圖b模拟了25個站點在5年60個月的犯罪資料,圖c、d為NMF分解的結果,c圖rank為3,d圖rank為5
如圖所示,我們制造四組資料模拟某一地區的犯罪事件:
A(B):從一組均值為8,方差為4的正态分布中抽取60個樣本,也就是說犯罪數量多且頻率大
C:從一組均值為1,方差為4的正态分布中抽取60個樣本,也就是說犯罪數量較少但是頻率大,而這類資料也是分析者感興趣的點,但是傳統的以數量統計為主的可視分析卻容易忽略這個點。
D:從一組均值為0,方差為0.25的正态分布中抽取60個樣本,但是在35和47這兩個點增加統計量,也就是說平時犯罪行為極少,但在特殊時期犯罪數目暴增。
這四個點都應該被判斷為犯罪熱點,但是傳統的以數量統計為主的可視分析卻容易忽略C、D這兩種情況。
從c圖矩陣分解的情況來看,W矩陣的列可以的表示出了我們想要的結果及高亮顯示。
(2)與高/低聚類算法(以下簡稱G)的對比
首先,大部分得到的熱點資料是重合的,重合率在98%左右
其次,經過如下分析,NMF得到的結果更為合理。
P:兩個算法都認為是熱點
F:NMF認為是熱點,但是G不認為是
G:G認為是熱點,但是NMF不認為是
N:都不認為是熱點
如圖a所示,NMP多發現的兩個區域均是離散的,且犯罪數量符合熱點定義,但我們看圖b,G多發現的兩個區域均和高犯罪區域臨界,且犯罪數量少,我們可以認為這是被高犯罪區域“污染”得到的。
NMF可以有效避免污染。
2.更加細粒度的分析
讓我們回顧一下第一張大圖,總覽這個系統,不帶執行個體來硬解釋這個系統的使用是枯燥難懂的,是以我希望可以帶着執行個體來為大家介紹每一個部分的用處。
(a)Control Menu:使用者可以手動設定資料集以及選擇的時間和熱點數目。
(b)Map View:使用者可以自由選擇感興趣的的區域,包括畫折線、點選、畫區域
(f)Ranking Type View:五種犯罪類型的排名随時間的變化
(g)Radial Type View:徑向圖,展示區域每種類型犯罪不同年份的數目以及占比
OK,結合以上三個子產品,我們用一個執行個體來了解究竟如何使用這些子產品
我們摘取了四個典型區域進行分析,C1(左下角)為商業區;C2(左上角)為金融機構區,這兩個區域都屬于市中心。R1為中産階級的居住區,R2位較富裕階級的居住區,這兩個區域均為住宅區。
在C1區域主要以路人搶劫(棕色)以及汽車搶劫為主,且由熱點圖可以得出,路網規則,具有較好城市基礎設施的地區汽車盜竊風險比較高。
在C2區域可以看出此地區貨物盜竊(綠色)這種犯罪類型一直在增長,但是整個區域内這種犯罪行為卻不多見。
從市中心轉移到居民區可以發現,R1(中産階級)巴士搶劫較常見,如R1-b所示,同時,由于站點較少,使用者可以友善的逐站點進行犯罪模式分析。
在R2區域,尤其在R2-d中家庭入室盜竊是最常見的犯罪,同時正在逐年增長。
由此可見借助CrimAnalyzer的這幾個子產品,我們可以靈活選中複雜區域,同時可以清楚地了解區域的犯罪模式(何種犯罪模式最常見、那種犯罪模式正在增長、犯罪行為集中在那些區域),進而可以讓我們靈活的互動分析。
© Hotspot View(d) Cumulative Temporal Vie
我們隻分析汽車搶劫(綠色)這個犯罪行為可以依照表盤看到,下圖熱點數量比上圖多了一個數量級,同時占比也更高,根據徑向圖可以看出來SP230雖然犯罪數目少,但是具有季節性特征(某一個季節數目激增),而BR116數目在逐年增長。
總結
總之這個論文很神奇,我明天再完善一下