引言
藝術之美根植于其所傳達的資訊。有時候,現實并非我們所看到或感覺到的。達芬奇(da vinci)和畢加索(picasso)等藝術家都通過其具有特定主題的非凡藝術品,試圖讓人們更加接近現實。
資料科學家并不遜色于藝術家。他們用資料可視化的方式繪畫,試圖展現資料内隐藏的模式或表達對資料的見解。更有趣的是,一旦接觸到任何可視化的内容、資料時,人類會有更強烈的知覺、認知和交流。
在資料科學中,有多種工具可以進行可視化。在本文中,我展示了使用python來實作的各種可視化圖表。
怎樣才能在python中實作可視化?
涉及到的東西并不多!python已經讓你很容易就能實作可視化——隻需借助可視化的兩個專屬庫(libraries),俗稱matplotlib和seaborn。聽說過嗎?
matplotlib:基于python的繪圖庫為matplotlib提供了完整的2d和有限3d圖形支援。這對在跨平台互動環境中釋出高品質圖檔很有用。它也可用于動畫。
seaborn:seaborn是一個python中用于建立資訊豐富和有吸引力的統計圖形庫。這個庫是基于matplotlib的。seaborn提供多種功能,如内置主題、調色闆、函數和工具,來實作單因素、雙因素、線性回歸、資料矩陣、統計時間序列等的可視化,以讓我們來進一步建構複雜的可視化。
我能做哪些不同的可視化?
剛出版不久的《a comprehensive guide on data visualization》中,介紹了最常用的可視化技術。在進一步深入學習前,如果你尚未閱讀此書,我們建議你參考此書。
以下是python代碼與其輸出結果。我就是用下面的資料集來建立這些可視化的。
導入資料集
1.直方圖
2.箱線圖
3.小提琴圖
4.條形圖
5.折線圖
6.堆積柱形圖
7.散點圖
8.氣泡圖
9.餅圖
10.熱圖
你可以嘗試繪制基于兩個變量的熱圖,如x軸為性别,y軸為bmi,資料點為銷售值。
結語
現在,你肯定已經意識到了資料可視化的美妙,為什麼不自己動手試試呢?在以後的文章中,我們還将探讨用python實作地圖可視化和詞雲。
大資料文摘也曾經釋出過用r進行資料可視化的文章,《用r語言進行資料可視化的綜合指南(一)》和《用r語言進行資料可視化的綜合指南(二)》。大家可以參考一下,做個對比。
原文釋出時間為:2015-11-09
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号