
CDA資料分析師 出品
編譯:Mika
我們不斷在創造着大量的資料。據估計,僅在2020年我們就産生了驚人的59澤位元組的資料。
随着如此多的資訊四處傳播,資料分析已經成為一個不可或缺的專業領域,這并不令人驚訝。
而這其中的一個關鍵部分就是資料可視化。
用圖表表示資料,能夠使我們發現新的見解,進行高層次的分析,并以清晰、簡潔的方式傳達我們的發現,同時這還是一種藝術形式。
在本文中,我們将列舉出2021年度那些令人驚豔的可視化作品與你分享。
如前所述,人類在2020年創造了大約59澤位元組的資料。要知道,人類在2010年代中期創造的資料才達到1澤位元組,這是一個令人難以置信的數量。随着世界範圍内數字化連接配接趨勢越來于強,我們的資料生産速度隻會更快。
1澤位元組相當于六億個位元組,到底是個什麼概念呢?不妨看看下圖。
(來源:The Guardian / Cisco)
上述可視化無疑使我們更容易了解1澤位元組到底有多麼龐大,這就是資料可視化的力量。
随着我們産生的資料量不斷增長,需要更複雜的可視化技術來了解它。一種越來越流行的資料形式是網絡圖,這讓我們繪制許多不同點或節點之間的關系。對于描繪可視化中出現的連接配接或群體,網絡圖是非常不錯的選擇。
(來源: Kirill Benzi )
這個醒目的網絡圖不僅僅是一張漂亮的圖檔。它追蹤了《星球大戰》宇宙中的2萬多個角色之間的聯系。每個角色都由一個節點代表。
其中紅色代表力量的黑暗面;藍色代表光明面;黃色表示罪犯和賞金獵人。總共有超過66,000個連接配接,這恰恰顯示了網絡圖可以有多麼強大。
随着智能手機能追蹤人們的行動,标記位置的資料正迅速成為一種普遍現象。這在新冠疫情期間被證明特别重要,因為各國争先恐後地跟蹤和追查潛在的感染鍊。在這個例子中,資料可視化軟體供應商Tectonix向我們展示了特定位置資料地圖的潛力。
(來源:YouTube / Tectonix GEO )
這個可視化圖顯示了2020年春假期間在佛羅裡達州收集的手機定位資料。每個手機信号都由一個紅色節點代表。紅色節點表示有很多人在享受春假。藍色強調的區域是勞德代爾堡的一個海灘。
(來源:New York Times / Tectonix GEO )
通過追蹤該海灘上的每個節點,Tectonix顯示了春假結束時個人旅行的确切地點。是以,我們可以很容易地看到來自該海灘的個人可能已經傳播新冠疫情的距離和範圍。
另一種常見的地圖類型是3D地圖。
雖然有些可視化使用3D元素來增加一點亮點,但最好的可視化是充分地利用三維空間。位于英國的資料分析公司Automatic Knowledge Ltd.的創始人Alasdair Rae在這一可視化過程中完美地說明了這一點。
(來源:Alisdair Rae / statsmapsnpix.com )
利用歐盟免費提供的GHS_POP資料,這些圖檔顯示了整個歐洲的人口密度。該地圖被分解成1公裡×1公裡的方塊,條形高度代表了生活在每個地區的人口數量。除了提供引人注目的效果圖外,我們還可以一目了然地看到哪裡是人口最密集的地區。例如,巴黎、倫敦、馬德裡和羅馬都脫穎而出。
如果沒有與資料分析相關的主題,那麼這篇文章是不完整的。
考慮到這一點,下面這個圖表就通過氣泡圖和循環網絡圖顯示了在CRAN上300個包中使用的流行程式設計語言。
(來源: Dr Torsten Sprenger / GitHub )
通過從TIOBE指數(衡量程式設計語言的流行程度)中獲得的資料,這個可視化顯示了哪些CRAN軟體包是用哪些語言建立的。其中R排在首位,其次是C和C++。不太流行的語言用小圓圈表示。每個圓圈的大小與制作軟體包所用的代碼行數成正比。
好的資料可視化不需要太過華麗。
如果資料可能被用來幫助政府政策或決策,那麼表述清晰是至關重要的。而折線圖就是能清晰、簡單地繪制時間序列資料的一個優秀工具。
(來源:UNEP GRID )
這張線圖追蹤了從1880年到2010年代末的全球表面溫度。重要的是,它包括來自四個不同來源的資料。NASA、NOAA、日本氣象局和MetOffice。通過疊加這四個來源的資料,不難注意到當中的密切相關性,它們均顯示了在過去200年裡全球表面溫度在不斷上升。
可視化不應該為了互動而互動。然而,互動性也可以改變我們看待資料的方式。Gov | DNA是一個獲獎的線上互動網絡工具,探讨了世界各國政府資料。
(來源:Werner Helmich )
該工具将每個國家表現為一個氣泡,讓你通過點選按鈕來比較不同的國家。例如,你可以根據就業、預期壽命、新聞自由和腐敗等變量追蹤每個國家的世界幸福指數。
流圖是一種面積圖,通常用于比較時間序列資料。雖然并不總是适合進行深入分析,但它們非常适合提供廣泛的概述。
(來源:Talia Bronshtein / insightfulinteraction.com )
由資料記者Talia Bronshtein創作的這幅美麗的流程圖描繪了200多年(1820年至2015年)來美國不同移民的國籍。
從中,我們可以看到,在二戰期間(1939-1945年),美國的移民幾乎停止了。還可以看到,二戰前的大多數移民來自奧匈帝國、意大利和俄羅斯等國;到21世紀末,大部分移民來自亞洲和南美國家。
資料可視化不僅僅是用于資料分析,可以是一種藝術形式。
2010年,藝術家Janet Echelman被委托創作一個圖,代表西半球35個國家的互相聯系。那一年,智利發生了大地震。這一事件的震級如此之大,以至于引發了一場巨大的海嘯,使地球的一天縮短了1.26微秒。
(來源:NOAA / PMEL / Center for Tsunami Research )
這張圖檔顯示了由美國國家海洋和大氣管理局(NOAA)模拟的地震引起的海嘯的熱圖。Janet Echelman以此為靈感創作了她的雕塑,她用不同顔色的繩子懸挂在一個輕巧的架構上。
(來源:Janet Echelman )
随後的雕塑名為1.26,這也證明了據分析可以和任何藝術領域一樣具有創造性。
2021,知名大資料網站FiveThirtyEight用精美的資料可視化講述了關于新冠疫情、政治局勢和體育界的故事。
這裡我們列舉了當中一些非常驚豔的可視化作品分享給大家。
新冠
美國不願意接種疫苗人群資料
大多數未接種疫苗的美國人認為疫苗的風險比感染新冠更大
白人孩子最不害怕新冠
政治
加州的罷免程式比大多數州都容易
通貨膨脹率上升給美國總統的支援率帶來影響
重新劃分選區的最新情況
科學
美國大型城市引領可再生能源的發展
美國各地的高溫,西部地區的火災和幹旱情況
15年調整平均值和記錄的大西洋盆地飓風資料,1851-2019
東京奧運會
沒有人能接近博爾特最佳時期的成績
奧林匹克運動會競賽項目年表1896-2020年
輪椅運動員在長跑中更能展現出優勢
體育
世界象棋桂冠争奪賽
更快并不一定意味着更好
金州勇士隊保持明星陣容
Matt Araiza的賽場罰球資料
LeBron James三分球資料
Patrick Mahomes 輕松投出長球
參考連結:
https://careerfoundry.com/en/blog/data-analytics/data-visualization-examples/
https://fivethirtyeight.com/features/our-51-best-and-weirdest-charts-of-2021/