天天看點

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

當可視化遇上“犯罪克星”

從2020年11月2日開始記錄我讀論文後的一些總結,希望可以見證自己的成長

文章目錄

  • 當可視化遇上“犯罪克星”
  • 前言
  • 一、本文講了什麼?
  • 二、為何需要這麼一套可視化分析系統?
  • 三、有何創新點?
    • 1.算法應用的創新
    • 2.更加細粒度的分析
  • 總結

前言

本文是我讀完IEEE VIS的論文《CrimAnalyzer: Understanding Crime Patterns in São Paulo》後的一些總結

提示:以下是本篇文章正文内容,下面案例可供參考

一、本文講了什麼?

本文将可視化技術應用于城市犯罪模式分析,設計了一套名為**“CrimAnalyzer”**的可視化分析系統,首先應用于聖保羅這一犯罪率極高的大城市,該系統可以靈活的分析不同地獄的犯罪模式(何種犯罪模式最常見、哪種犯罪模式正在增長、犯罪行為集中在那些區域),解釋了犯罪形式随時間的演變,提供派警、預防行為的指導,輔助警局。

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

二、為何需要這麼一套可視化分析系統?

欠發達國家大型城市一直受安全問題困擾,聖保羅就是其中的典範。可視化作為一種資料分析的工具,已經在城市犯罪資料領域得到了應用,如Crimemapping,但他們往往局限于單純的統計犯罪事件以及數量,難以進行可視推理。

三、有何創新點?

1.算法應用的創新

采用了NMF(非負矩陣分解)來進行犯罪熱點的偵查,相較于傳統的Getis-Ord General G(高/低聚類算法)而言,速度更快,效果更好。

(1)NMF應用介紹:

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

圖a為某一區域的25個站點并标記了四個站點,圖b模拟了25個站點在5年60個月的犯罪資料,圖c、d為NMF分解的結果,c圖rank為3,d圖rank為5

如圖所示,我們制造四組資料模拟某一地區的犯罪事件:

A(B):從一組均值為8,方差為4的正态分布中抽取60個樣本,也就是說犯罪數量多且頻率大

C:從一組均值為1,方差為4的正态分布中抽取60個樣本,也就是說犯罪數量較少但是頻率大,而這類資料也是分析者感興趣的點,但是傳統的以數量統計為主的可視分析卻容易忽略這個點。

D:從一組均值為0,方差為0.25的正态分布中抽取60個樣本,但是在35和47這兩個點增加統計量,也就是說平時犯罪行為極少,但在特殊時期犯罪數目暴增。

這四個點都應該被判斷為犯罪熱點,但是傳統的以數量統計為主的可視分析卻容易忽略C、D這兩種情況。

從c圖矩陣分解的情況來看,W矩陣的列可以的表示出了我們想要的結果及高亮顯示。

(2)與高/低聚類算法(以下簡稱G)的對比

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

首先,大部分得到的熱點資料是重合的,重合率在98%左右

其次,經過如下分析,NMF得到的結果更為合理。

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

P:兩個算法都認為是熱點

F:NMF認為是熱點,但是G不認為是

G:G認為是熱點,但是NMF不認為是

N:都不認為是熱點

如圖a所示,NMP多發現的兩個區域均是離散的,且犯罪數量符合熱點定義,但我們看圖b,G多發現的兩個區域均和高犯罪區域臨界,且犯罪數量少,我們可以認為這是被高犯罪區域“污染”得到的。

NMF可以有效避免污染。

2.更加細粒度的分析

讓我們回顧一下第一張大圖,總覽這個系統,不帶執行個體來硬解釋這個系統的使用是枯燥難懂的,是以我希望可以帶着執行個體來為大家介紹每一個部分的用處。

(a)Control Menu:使用者可以手動設定資料集以及選擇的時間和熱點數目。

(b)Map View:使用者可以自由選擇感興趣的的區域,包括畫折線、點選、畫區域

(f)Ranking Type View:五種犯罪類型的排名随時間的變化

(g)Radial Type View:徑向圖,展示區域每種類型犯罪不同年份的數目以及占比

OK,結合以上三個子產品,我們用一個執行個體來了解究竟如何使用這些子產品

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

我們摘取了四個典型區域進行分析,C1(左下角)為商業區;C2(左上角)為金融機構區,這兩個區域都屬于市中心。R1為中産階級的居住區,R2位較富裕階級的居住區,這兩個區域均為住宅區。

在C1區域主要以路人搶劫(棕色)以及汽車搶劫為主,且由熱點圖可以得出,路網規則,具有較好城市基礎設施的地區汽車盜竊風險比較高。

在C2區域可以看出此地區貨物盜竊(綠色)這種犯罪類型一直在增長,但是整個區域内這種犯罪行為卻不多見。

從市中心轉移到居民區可以發現,R1(中産階級)巴士搶劫較常見,如R1-b所示,同時,由于站點較少,使用者可以友善的逐站點進行犯罪模式分析。

在R2區域,尤其在R2-d中家庭入室盜竊是最常見的犯罪,同時正在逐年增長。

由此可見借助CrimAnalyzer的這幾個子產品,我們可以靈活選中複雜區域,同時可以清楚地了解區域的犯罪模式(何種犯罪模式最常見、那種犯罪模式正在增長、犯罪行為集中在那些區域),進而可以讓我們靈活的互動分析。

© Hotspot View(d) Cumulative Temporal Vie

論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結
論文閱讀:CrimAnalyzer:可視化分析聖保羅犯罪模式當可視化遇上“犯罪克星”前言一、本文講了什麼?二、為何需要這麼一套可視化分析系統?三、有何創新點?總結

我們隻分析汽車搶劫(綠色)這個犯罪行為可以依照表盤看到,下圖熱點數量比上圖多了一個數量級,同時占比也更高,根據徑向圖可以看出來SP230雖然犯罪數目少,但是具有季節性特征(某一個季節數目激增),而BR116數目在逐年增長。

總結

總之這個論文很神奇,我明天再完善一下

繼續閱讀