引言
幾十年來,在資料可視化實踐上進行了大量研究,包括在當今學術界和商界中進行的一系列新研究。
但是對從事這些工作的從業者自身還沒有什麼研究:
什麼人在做資料可視化?
在哪些組織和這些組織内的哪些部門有這些專業工作?
他們在做什麼類型的資料可視化,以及出于什麼目的?
他們的工作是否有影響力?如果是,有什麼類型的影響?
為什麼其中一些人比其他人有更大的影響力——也即,什麼使得他們在其工作上比其他人更成功?
随着這一領域的發展和成熟,這些問題正在(或将很快)被各地的組織機構所問到。
這項調查是開始闡明資料可視化工作狀态和性質的一個嘗試。 在2016年夏季和早秋時分,我們線上收集了近100份(精确地說有99份)來自資料可視化專業人士的調查報告。 受訪者是自我選擇的,并通過社交媒體獨家推廣。
主要結論
1.從業者正在使用一系列廣泛的難以置信的工具來完成他們的工作,與此同時,一些市場上司者也開始出現。
2.“增加了解”是資料可視化的主要目标,但除此之外,意見各不相同。
3.良好的資料和訓練有素的員工是成功的關鍵,而在資料中“找出故事”仍然是許多人面臨的一個關鍵挑戰。
4.那些正在衡量其成果的人預計,可視化的支出會增加,近五分之一的人預計會有顯著增長。
上司者vs落後者
評估調查資料最有趣的方法之一是将某些活動(在這種情況下為資料可視化)中的“上司者”與“落後者”進行比較。那些制造趨勢并在其組織中有着更大影響的人與那些影響較小的人有什麼不同? 在這次調查中,有兩個問題幫助我們區分領先者與落後者。
受訪者被問及:“總體上,您所在組織的可視化資料做得有多好?”可選用的答案是從“非常差”到“很好”的五點李克特量表(likert scale)。 這個問題,顯然不是“上司力”或“落後”的科學證據,但可以用來衡量一個組織對自身業績擁有(或缺乏)的信心。 這是所有以下“自信組”與“不确定組”比較的來源。 這兩個群體都由41個受訪者所構成。
總體上,您所在組織的可視化資料做得有多好?
受訪者還回答了這個問題:“如果您正在評估成果,您是否在您的可視化項目中看到roi(投資回報率)(财務方面或者其他)?”這個問題也提供了一個從“非常積極”到“非常負面”李克特量表選項。 取得“正投資回報率”(proi)受訪者是那些回答“非常積極”或“有點積極”的人,剩下的是回答“中性到負的投資回報率”(n2nroi)的人。 有28名proi受訪者(其測量結果的53%)和25名n2nroi(47%)受訪者。 正如人們所期望的,proi組中的75%也在自信組。 n2nroi組在“自信”(44%)和“不确定”(56%)之間分布更均勻。
如果您正在評估成果,您是否在可視化項目中看到roi(投資回報率)?(财務方面或者其他)
在“上司者”和“落後者”這兩組之間有什麼差別? 很難得出廣泛的結論。 無論如何,我盡可能指出他們的不同,并給出結論。
工具!工具!更多的工具!
這項調查最令人驚訝的發現集中于所使用的工具。 當被問及“貴組織用于資料可視化最常用的3個軟體工具是什麼?”時,答案是非常不同的。
我們得到的答案是有不止62種不同的工具被使用。并且這是在将“我們自己的平台”和“其他圖像和圖表”等答案彙總到一個“其他”分組中,以及将任何adobe軟體劃分到一組之後的答案。
同樣有趣的是,所使用工具的多樣性是許多受訪者所依賴的工具類型。 excel - 用于計算和建立圖表的電子表格,釋出于30多年前 – 提及的次數最多(43),其次是第二組流行工具:tableau(26),adobe suite(25)和d3 (21)。然後最接近的是r,被提及12次。 其餘的大多數都隻有被提及一次或者幾次。
這究竟是一個有着守舊的壟斷者主宰了市場佔有率和影響力的成熟行業? 還是一個對于新工具有着足夠空間來擴散及主導的不成熟行業? 或者,這是一個正在成熟的行業,其中的标準正在制定中,各種公司正在營造下一個壟斷者?
我認為答案是非常肯定的“是”(在一定程度來說,以上三種都對)。 很難準确預測未來對資料可視化工具有着怎樣的影響。 傳統的主導工具很難被取代。 同時,新的工具又不斷地出現。 但在較新的工具中,tableau和d3正在成為清晰的标準。 這裡還有空間給其他人分一杯羹嗎?如果考慮到大量的工具在使用,毫無疑問是有的。
那麼自信組和不确定組的情況又是如何呢? 他們是否使用不同的工具? 自信組比不确定組更多使用tableau和excel,而使用d3和adobe工具的以同樣大的差距少于不确定組。 這究竟意味着什麼? 很難說。 但很有意思,值得進一步調查。
與自信組和不确定組的受訪者相比,proi組和n2nroi組的受訪者有不同的工具使用模式,表明可衡量的成功與信心之間存在明顯的差別。 例如,tableau在兩個組中的使用情況相同,其他所有三個頂級工具正在proi組中得到更廣泛的使用。那麼, 那些看到成功的人,更有可能使用更多的“自定義”工具,如d3和adobe? 或者他們更可能使用的頂級工具範圍更大? 這很難得出直接的結論,但這同樣是一個值得更多研究的領域。
本工作的第一目标:增強觀看者對資料的了解
人們出于各種原因而可視化資料。 這并不奇怪。 但令人驚訝的是(确切的說是令人欣慰),當被問到“當你的組織正在可視化資料時,你的主要目标是什麼?”時,90%的受訪者認為是”增加了解“。遠遠超過第二個回答”影響影響者 “,隻有40%選擇了該選項。 當我講授讓資料講故事和可視化時,我認為增加了解應該是主要目标,是以很高興看到幾乎所有的同行都同意!
當您的組織正在将資料可視化時,您的主要目标是什麼? (如果你在為客戶提供資料可視化的機構工作,請确定其主要目标。)(選中所有适用選項。)
再一次得到非常多樣的回答,多個受訪者(實際上,每種情況都有超過10%的受訪者)從提供的選項選擇相同的關鍵目标。 (一個例外是“接受投票”。這項調查是在總統選舉期間進行的,是以也許所有的政治工作者都忙于為候選人拉票,沒有回答問卷調查!)
自信組和不确定組之間的最大差別是,自信組(32%)中“提高品牌知名度”幾乎是不确定組的兩倍,“提高品牌知名度”很難評估。 同時,與n2nroi(12%)相比,“獲得媒體報道”對于proi(36%)來說是一個更重要的目标,這很容易(是以經常)被評估。 是以,與那些不切實際的人相比,尋求媒體報道的人更有可能感覺到他們獲得了proi。
成功必備因素:好的資料和訓練有素的員工排名靠前
調查中的多個問題有助于确定資料可視化面對的挑戰和成功的秘密。
其中最令人激動的發現之一是投資回報率。 在所有評估其工作成果的受訪者(僅占所有受訪者的一半)中的53%表示他們看到“非常樂觀”或“有點樂觀”的投資回報率。 隻有4%的受訪者看到負面的投資回報率。 是以,96%的受訪者表示有正的或至少中性的投資回報率。 每個報告“非常樂觀”的投資回報率的人都屬于自信組。
什麼導緻成功? “好的資料”(71%),“訓練有素的員工”(70%)和“正确的工具”(61%)主導了所有的回答。 雖然“文化”不是多項選擇中的一個選項,但它出現在“其他”選項中的手工輸入中。 例如,有一個人說,“有一個熱情的‘資料能手’等同于從進階職員到基層人員都是‘資料可視化能手’”。
資料可視化項目成功的關鍵因素是什麼?
有趣的是,一個類似的問題作為開放問題被提出時,得到的結果有點不同于多重選擇的。 在開放式回答中,工具被排到清單底部,受訪者更加注重教育訓練、人才、文化、投資回報率、資料品質和故事的講述。
自信組(confident)和不确定組(unsure)解答多項選擇的主要差別是,自信組中有非常高的比例的人(83%),認識到需要好的資料,相較而言,不确定組隻有59%的。 再次,proi和n2nroi組與自信組(confident)和不确定組(unsure)有着顯著不同。 足足有86%的proi組将訓練有素的員工(trained staff)确定為關鍵成功因素,而n2npoi組僅為60%。可以了解的是,n2nroi組更可能将“足夠的資金(sufficient funding)”(24%,而proi組為11%)确定為關鍵成功因素。
當被問及“您所在的組織在可視化資料時所面臨的最艱巨的挑戰是什麼?”,再一次,我們有多個受訪者(每個組超過10%)選擇每個可選答案。“找出故事(figuring out the "story")”(48%),“找到時間(finding the time)”(41%)和“清理資料(cleaning the data)”(40%)領先。 自信組(confident,59%)與不确定組(unsure,24%)相比,認為“找到時間(finding the time)”更難。與此同時,不确定組(unsure)的人更糾結于找到人才(finding the talent,39%)和預算(finding the budget,29%),而自信組(confident)分别為22%和15%。
您所在的組織在可視化資料時面臨的最艱巨的挑戰是什麼?(選擇所有适合的選項)
proi和n2nroi組之間的最大差異又一次不同于自信組(confident)和不确定組(unsure)。proi難以“找出故事來溝通(figuring out the story to communicate)”(61%,相比n2nroi的40%),而n2nroi難以“分析資料(analyzing the data)”(32%,相比proi的21%)。n2nroi更不可能“難以找出故事”是因為他們傾向于容易地搞明白或因為他們甚至沒用考慮一下故事?他們真的是難以做資料分析或隻是受訪者認為那是個困難的部分隻因為他們是做那個工作的人? (這可能很容易将他們對自己所做工作難度感到驕傲等同于“掙紮”)。
值得一提的是,正如文化是受訪者所描述的關鍵成功因素之一,它看起來也是許多人需要克服的障礙。一個受訪者表示:“需要文化向資料可視化變遷”。
支出:絕大多數預算低于25萬美元的增長
根據他們自己的估計,在回答“您認為在2016年您的組織打算在資料可視化方面花多少錢?”時,大多數受訪者(51%)每年支出低于5萬美元,而87%的受訪者支出低于25萬美元 。這組受訪者偏向于來自于規模較小的組織(73%來自雇員少于1000人的公司),是以這個結果并不奇怪。除了所有回答每年花費超過1百萬美元的人屬于自信組(confident)外,自信組(confident)和不确定(unsure)組之間沒有顯著差異。
您認為在2016年您的組織打算資料可視化方面花多少錢?
比總支出更有趣的是随着時間的變化,受訪者是如何看待支出的變化。 幾乎沒有人(4%)表示他們預計在未來一年資料可視化方面的支出會縮減。43%的人預期支出會有所增長或顯著增長。 自信組(confident)更有可能(7%)說會顯著增長,相較而言,不确定組(unsure)這麼認為的隻有2%,但這仍是一個小數字。proi組更有信心,61%的受訪者期望增長(相比之下n2nroi組為28%),18%的受訪者期望有顯著的增長。有趣的是,與自信組(confident)和不确定組(unsure)相比,即使是n2nroi組的預期也有較高水準(12%)的顯着增長。
在2016年到2017年間,您的組織在資料可視化方面的支出會變化多少?
結論
那麼,對資料可視化專家來說,所有這些意味着什麼? 資料點出了如何改進他們的工作群組織影響的幾個結論。
明智地選擇您的工具
資料可視化工具集是巨大并且不斷增長的,但也圍繞一些上司者在鞏固着。您的組織需要合适的工具來完成工作,您需要選擇那些工具,它們是能夠更容易找到人才來使用的工具,無論是現在,還是在未來。您需要易于使用且功能足夠強大的工具,并且它們允許您建立能夠和閱聽人對話的視覺效果。
明白為什麼您在做這些自己正在做的事
這似乎顯而易見,但您需要真的想想為什麼您要将可視化的資料放在第一位。您不需要因為其他人都這樣做而這樣做,正如幾乎所有的受訪者都同意的,您需要做到“增加了解”,并且實作特定的目标。了解您的目标,衡量您的結果,改變您正在做的,用以改善這些成果。
克服挑戰
好的資料,訓練有素的從業人員,文化和找出故事是人們在這個宇宙中發現的具有挑戰性的事情。是以,建構一個以資料為中心的組織,并将可視化視為一種強大的資料通信工具。并向大量員工提供教育訓練和支援,即使這些員工不直接參與可視化工作,他們也将緊跟可視化的潮流。
跟随上司者
基于幾個問題和方差,以及如何将proi和n2nroi與其餘的資料集進行疊加,可以得出結論,無論實際的roi如何,單單測量結果就可能使一個人成為“上司者”。proi和n2nroi組比任何其他群體都期望明年資料可視化支出有更高的增長率。這兩組相比于自信和不确定組,在他們認為主要成功因素和挑戰上的差異上,在整體上更加接近一緻。
接下來
和大多數調查一樣,尤其是第一類調查,這個調查帶來了更多的問題,而不是答案。 我很想跟進很多問題,如下(但遠遠不限于此):
- 為什麼您用這些您正在使用的工具?确切地說,如果您發現更好的工具是一個關鍵的成功因素,那将意味着什麼?
- 根據您确定的目标、挑戰和成功因素,您可以在2017年實作或克服什麼?例如,教育訓練是重要的,那麼您和您的同僚具體需要什麼教育訓練?
- 您如何衡量您的成功?
- 您的文化如何進行轉變?
資料可視化實踐是一個年輕正在成長的領域。它是任何組織中許多不同角色和部門内的活動子集。給它下定義是困難的,但可以為在這個領域工作的我們所有人闡明什麼可行,什麼不可行。随着它的成熟,我們應該看到很多,像所用的工具在數量上的縮減和鞏固、預算和支出增加,同時也對主要挑戰和成功因素有了更明确的方向。
明年,我們會再次進行這項調查,我希望得到更多社群裡的人們的支援和參與。如果您能想到一些問題您想要添加到明年的調查中,或者對今年的這些問題的改進和調整,請與我分享!也請不要猶豫與我分享任何其他想法。
注意
該項線上調查(托管于surveymonkey.com)在2016年春季開發,并線上共享到2016年10月結束。它由社交媒體獨家推廣。由于受訪者人數和這個非随機抽樣的數量很少,科學的來講,它不能被認為是準确的,但是提供了有趣的見解。在上面的總結報告中,為了簡單起見,所有百分比都被四舍五入了。
其他問題和資料
所有額外的問題和回答如下所示,完整的原始結果可供下載下傳。隻需發送電子郵件至[email protected]請求回複。
以下哪項最能描述您的組織?
受訪者主要來自專業服務、高科技行業。
您的組織大小?
受訪者所在組織規模普遍較小。
以下哪項最能說明您在組織中的角色?
受訪者的職位主要為資料分析師、研究員。
您所在的組織中有哪些部門定期并且頻繁地可視化資料?
所在組織中,分析部門和市場營銷部門的資料可視化頻率最高。
您所在的組織中有多少人經常處理資料可視化?
一個組織裡進行資料可視化工作的通常有1-4人。
您所在組織中有多少人經常使用其他人建立的資料可視化?
組織間,經常使用他人建立的可視化的人群規模差異不明顯。
您的資料可視化工作是由您所在組織中的員工還是供應商完成的?
資料可視化主要是由各組織中的員工自己完成的。
您所在組織的年度營運預算是多少?
受訪者在不同年度預算的組織間分布較均勻。
當您所在的組織可視化資料時,目标閱聽人是誰?(如果您與代理商合作為客戶進行可視化,請從客戶的角度回答這個問題 - 例如,如果您為客戶的員工開發可視化資料,則可以選擇“内部閱聽人internal audiences”。)
可視化結果既有外部閱聽人,也有内部閱聽人。
當您所在的組織可視化資料時,您可視化内部資料還是外部資料? (如果您為代理商為客戶進行可視化工作,請從客戶的角度回答問題 - 例如,如果您為客戶開發其内部資料的可視化,則可以選擇“内部資料(internal data)”。)
用于可視化的資料,既有内部資料,也有外部資料。
當您所在的組織可視化資料時,下列哪一項最能描述輸出? (可解釋性vs探索性經驗)
可視化分析中,解釋性分析比探索性分析更普遍。
在為您所在的組織可視化資料時,您是否測量與銷售、籌集資金等目标相關的結果?
多數組織對銷售額、籌資相關資料進行了一定的分析。
原文釋出時間為:2017-02-28
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号