天天看點

《資料科學與大資料分析——資料的發現 分析 可視化與表示》一2.6 第5階段:溝通結果

本節書摘來自異步社群《資料科學與大資料分析——資料的發現 分析 可視化與表示》一書中的第2章,第2.6節,作者【美】emc education services(emc教育服務團隊),更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

在運作模型之後,團隊需要将模組化的成果和之前建立的成功與失敗的衡量标準進行比較。在第5階段中,如圖2.7所示,團隊需要考慮以何種最佳方式向團隊成員和利益相關者闡述項目的發現和成果,包括警告、假設和結果的不足。因為項目示範常常面向整個組織機構,是以需要采用聽衆可以了解的方式來恰當地表達成果和定位發現。

《資料科學與大資料分析——資料的發現 分析 可視化與表示》一2.6 第5階段:溝通結果

在第5階段,團隊需要确定項目是否成功達到既定目标。許多時候,人們不願意承認失敗,但在這個情況下失敗不應該被視為真正的失敗,而是資料不能充分地驗證或否定一個給定的假設。這聽起來有些違背常理。但是,團隊在确定資料是否會證明或否定在第1階段中提到的假設時必須足夠嚴謹。有時團隊隻做了一些膚淺的分析,其不足以驗證或否定一個假設。有時團隊做了深入的分析卻試圖展示并不存在的結果。在分析資料時要在這兩個極端之間找到平衡,在展示實際結果時要實事求是。

當進行評估時,要确定結果是否有統計上的顯著意義和有效性。如果是的話,要明确交流時需要突出哪些提供了顯著發現的結果。如果結果是無效的,要考慮如何對模型進行改進和疊代以生成有效結果。在這一步中,要評估結果并确定哪些資料出人意料,哪些與第1階段提出的假設一緻。将實際結果與早期制定的想法相比較,可以産生額外的想法和見解。如果團隊沒有花時間來制定最初的假設,則将錯過這些額外的想法和見解。

此時,團隊應該已經确定哪種或哪些模型可以最佳地解決分析挑戰。此外,團隊應該已經對項目的某些發現有所認知。在這個階段,一種最佳實踐是記錄所有的發現,然後選擇三個最重要的發現分享給利益相關者。此外,團隊需要反映這些發現的含義和評估其業務價值。取決于模型産生的結果,團隊可能需要花費時間量化結果帶來的業務影響,以幫助準備項目示範和展示發現的價值。doug hubbard的著作[6]為如何評估企業無形資産和量化看似不可預測的事物價值提供了見解。

既然團隊已經運作了模型,完成了周密的發現階段,并對資料集有了充分了解,就應該反思項目,思考項目遇到的阻礙和可以改進的方面。要為後續工作或現有過程的改進提供建議,還要考慮每一位團隊成員和利益相關者需要怎樣履行其個人職責。例如,項目發起人必須為項目提供支援,利益相關者必須了解模型如何影響流程(例如,如果團隊建立了一個模型用于預測客戶流失,市場營銷團隊必須了解如何在規劃措施時使用這個模型)。生産工程師需要實施已經完成的工作。此外,在這個階段要強調工作的商業價值,并開始在生産環境中實施項目成果。

這一階段完成時,團隊将會記錄從分析中得出的重要發現和主要見解。這個階段傳遞的成果對于利益相關者和贊助商來說将是最看得見的,是以要小心清楚地闡述結果、方法論和發現的商業價值。第12章将詳細講解資料可視化的工具和引用文獻。

繼續閱讀