天天看點

資料可視化工具是否可容開源一席之位?

目前,商業工具在資料虛拟化軟體市場占據主導地位,但在資料管理和分析等領域,開源技術開始迎頭趕上,比如d3.js資料可視化庫,leaflet地圖庫,再加上附加互動可視化功能的r語言(一種廣泛用于統計分析的程式設計語言)。

當然,對于開源資料可視化工具也有一些批評的聲音,例如有人認為這些工具的使用門檻太高,使用者必須具備大量代碼知識,還要經過專門教育訓練。不過,熟悉開源可視化工具的使用者透露,随着技術部署的不斷深入,這些可視化産品用起來會越來越得心應手。而對于r語言,很多軟體供應商都為企業使用者提供商業産品。

bradley的觀點得到了clement brunet的認同,brunet是美國保險公司the co-operators的研究和分析主管。在波士頓舉行的資料倉庫研究院(tdwi)2015大會演講上,brunet表示:“有r語言在手,你可以走的很遠。”他認為如果要在概念證明(poc)階段開展實驗性分析項目,之後再擴充到産品應用,那r語言簡直是不二之選。而且随着r語言環境在本質上變得更加圖形化,工作會越來越容易。

如果要簡化流程,咨詢公司powertrip analytics的聯合創始人兼首席資料科學家stephen mcdaniel建議使用具有省略資料發現功能的開源可視化工具,可以讓使用者專注于建立表格和圖形。華盛頓大學開發的開源工具lyra備受mcdaniel青睐,他稱之為“資料可視化領域的photoshop”。

mcdaniel介紹道,lyra采用d3架構,d3架構是javascript文檔的組合,需要使用者執行一些手動編碼,可以通過點選式(隻要用滑鼠點選而不用鍵盤操作就可以使用的容易上手的軟體)界面自動完成任務。因為輸出格式采用的是html、svg或css等常見的網站語言,是以資料可視化結果很容易在組織中傳播,也很容易釋出到網上。他還表示:“這正是我們所需要的,現在我們要做的不是如何反複研究資料,而是如何建構具體的圖形,把他們釋出到網站伺服器上,融入到内容中,讓所有人都能使用。”

本文作者:佚名

來源:51cto

繼續閱讀