天天看點

第3章 時間資料可視化

目錄

1  時間資料在大資料中的應用

1.1 時間的概念

1.2 時間型資料的概念

2  離散型時間資料可視化

2.1 離散型資料的概念

2.2 離散型資料的可視化

3  連續型時間資料可視化

3.1 連續型資料的概念

3.2 連續型資料的可視化

4  其他可視化表達方式

4.1 點線圖

4.2 極區圖 

4.3 時鐘圖表

4.4 網格圖 

4.5 螺旋圖

4.6 熱圖

1  時間資料在大資料中的應用

1.1 時間的概念

•對于資料來說,時間是資料非常重要的次元和屬性

•應用:曆史資料的積累是資料“大”的一個重要原因

1.2 時間型資料的概念

• 按時 間順序排列的一系列資料 值 • 與一般的定量資料不同,時間型資料包含時間 屬性 • 時間 資料可以分為連續型時間資料和離散型時間資料 兩種

2  離散型時間資料可視化

2.1 離散型資料的概念

• 資料來源于具體的時間點或者時間 段 • 時間 資料的可能取值是 有限的 • 例如 :奧運會獎牌的 總數

2.2 離散型資料的可視化

(1)散點圖

定義: 由一些散亂的點組成的圖表。

應用場景:對于處理值的分布和資料點的分簇,散點圖都很理想。如果資料集中包含非常多的點,那麼散點圖便是最佳圖表類型。

(2)單一柱狀圖

定義:柱形圖又稱條形圖、直方圖,是以寬度相等的條形高度或長度的差異來顯示統計名額數值多少或大小的一種圖形。

适用場景:

Ø适合表示離散時間資料的趨勢,且資料條個數一般不超過12條。 Ø适用于單類别資料的時間趨勢表示,即系列值單一的資料。

不适用場景:

Ø不适合展示連續時間的變化趨勢。 Ø不适合資料條過多的離散時間的趨勢展示。

 (3)并列柱狀圖

當需要對比某一離散時間上的多個系列,以及展示随時間的變化趨勢時,并列柱狀圖是一種選擇。

但是要注意一點,并列柱狀圖的屬性系列,通常不能超過3條,否則圖表橫向空間會比較擁擠,展示的效果也不好。

(4)堆疊柱狀圖

反映各個離散時間點總體的構成部分是如何随着時間而變化的

堆疊柱狀圖,按照堆疊的部分,展示的是實際體量還是相對體量,可以分為兩類:

Ø普通堆疊柱狀圖:展示實際體量 Ø百分比堆疊柱狀圖:展示相對體量

3  連續型時間資料可視化

3.1 連續型資料的概念

• 連續型資料就是指任意兩個資料點之間可以細分出無限多個數值,它表現的是不斷變化的現象。 • 例如,溫度、股市 實時 行情 …… • 連續時間資料的可視化和離散時間資料的可視化相似。因為就算資料是連續的,我們采集的資料大部分還是離散且有限的。

3.2 連續型資料的可視化

(1)階梯圖

• 某兩個相鄰的時間節點,後一個節點的資料相對于前一個節點資料的升降變化,常用于商品價格 變動、 稅率變化等場景中 。

(2)折線圖

• 折線圖是用直線段将各資料點連接配接起來而組成的圖形,以折線方式顯示資料的變化趨勢 。适用于 趨勢類的需求,人口增長趨勢,書籍 銷售量 … • 點線圖:當 資料集中的資料項有限,不超過 12 個時,采用此種點線圖比較合适。有時候,對應日期的資料點上方,會直接顯示數值。 • 折 線圖 :當資料集中的資料項比較多,大于 12 條時,采用點線圖,會讓整條線上的點很密集,影響看資料的趨勢 ,此時折線圖 是不錯的選擇。 • 曲線圖:相比于折線圖,曲線圖相鄰節點的連線更加平滑,可視化效果也更加美觀。

(3)拟合曲線圖

• 根據 所給定的離散資料點繪制的曲線,稱為不規則曲線。 • 應場景 有 :擷取 的資料很多,或者資料很雜亂,可能很難甚至無法辨認出其中的發展趨勢和模式 • 若我們想要研究資料随時間的變化所表現出來的整體趨勢時,可以根據多個離散點( T1,D1 )、( T2,D2 ) …. 、( Tn,Dn ),拟合一個最接近的一個連續函數關系。 

4  其他可視化表達方式

4.1 點線圖

• 點 線圖是離散型資料可視化的一種形式。 • 可以說點線圖是柱形圖的一種變形,但更令人聚焦到端點。 • 股市中有一種特殊的點線圖。 Ø 一條線表示一個交易時段 Ø 一個點表示收市價 Ø 線高低點表示最高價及最低價 Ø 可以讓投資者了解市價與當時交易時段高低價的關系,代表市場氣氛傾向樂觀或悲觀

4.2 極區圖 

• 又名南丁格爾玫瑰圖 • 一 種圓形的直方圖,傳達士兵的死亡 情況。 • • 淺灰:死于可預防的 疾病 • 紅色:死于槍傷 • 褐色:死于其他原因 • 按月劃分

4.3 時鐘圖表

• 一 格: 1 小時 • 白色:睡眠 • 綠色:主要工作 • 土黃 色:社交及用餐 • 藍色:運動 • 灰色:從事其他工作

4.4 網格圖 

• 和月曆相對應 • 一般采用表格映射的方式 • • 紅色:股指下跌 • 綠色:股票上漲

4.5 螺旋圖

• 也稱為時間系列螺旋圖。沿阿基米德螺旋線畫上基于時間的資料。 • 圖表從螺旋形的中心點開始往外發展 。 • 螺旋形式多變 ,可使用條形、線條或資料 點,沿着 螺旋路徑顯示。

适合用來顯示大型資料集,通常顯示長時間段内的資料趨勢,是以能有效顯示周期形性的模式 

4.6 熱圖

• 熱圖通過色彩變化來顯示資料,當應用于表格時,熱圖适合用來交叉檢查多變量的資料 . • 熱圖不局限于時間資料的可視化,适用于顯示多個變量之間的差異,顯示是否有彼此相似的變量以及彼此之間是否有相關性。 • 由于熱圖依賴顔色來表達數值,難以提取特定資料點或準确指出色塊間的差異。