天天看點

大資料可視化的三大認識誤區

最近,很多企業都在談資料可視化,其受關注的程度不次于大資料。資料可視化是正确了解資料資訊的最好方法,甚至是唯一方式。出色的可視化産品可以讓使用者對自己目前關注的事情一目了然,并可以快速給出建議,随時随地分享。在大資料時代,如果你的資料展示方法不對,可能會破壞資料可視化效果。

大資料可視化的三大認識誤區

誤區一:顯示所有的資料

盡管我們多次被告誡,大多數人并不關心你對多少資料做了多少量化名額的處理,他們不在乎你每天可以處理多少資料,或您的hadoop叢集有多大。使用者想要的是具體的或者相關的答案,并且他們希望越早得到越好。但是有些資料可視化工具,還是會把無關的資料顯示在頁面上,目的是希望接近企業所需,但事實上造成了使用者很難找到有價值的資訊。

現在儀表闆應用非常流行,其指導思想是可以“顯示所有狀态的資料。大多數性能是枯燥的資料展示,而多異化功能則被隐藏。其實,好的儀表闆資料展示,是把重要資料做了了趣味化的展示處理。讓使用者做一個有效排序,哪些是優先處理,哪些需要延後處理。資料可視化可以達到儀表盤達不到的能力,可以更好地處理資料報告。

誤區二:顯示錯誤的資料

顯示錯誤的資料和顯示所有的資料同樣存在隐性危機。在資料可視化操作中,顯示的資訊子集與資料是相關的關系。比如你關心銷售資料,您可能也關心每個地區或者個别銷售人員的銷售資料,考慮通過資料做出決策。把幾個關聯性很強的圖表進行折中處理,選擇一個圖檔來展示,這實際上需要一個複雜的資料可視化能力來完成,而且相關幾個圖檔的資料必須做到幹淨、清晰。

誤區三:美化資料展示結果

即使你采用幹淨的資料繪制圖表,你仍然會弄錯。因為特殊化的表格類型展示很少見,絕大多數的可視化需求都是用來滿足線形圖、餅圖等基本圖形。

要想美化資料展示,在處理關鍵資料字與段之間的關系時,就應該考慮把指定字段加在坐标軸上。按照組别、類别、資料時間、資料量級以及重要性進行劃分,尤其是顔色類别一定要有,并且可以自定義亮度和飽和度,確定在使用本标簽或者其他标簽的時候做到準确無誤。

為了避免失誤,最好的方法是專注于你的目标。在可視化應用之前就應該考慮:我們關心什麼?需要做什麼?要解決什麼問題?要看到怎樣的資料?以怎樣的結構和關系來展示?要突出哪些資料?當你能夠回答這些問題時,你就可以進行資料可視化的設計或者應用了。

本文作者:danny

來源:51cto

繼續閱讀