天天看點

大資料在媒體行業的應用——《企業大資料實踐路線》之二

作者:阿裡雲MVP戚俊

本文系《MVP時間》視訊課程《4節課看懂企業大資料實踐路線》的文字版,視訊請看

MVP時間課程首頁

本期視訊可見

課程直通

上期内容回顧:

《企業大資料實踐路線》之企業大資料的現狀與痛點

下期内容連結:

解析業務資料的特征——《企業大資料實踐路線》之三

上期我們講了企業大資料的現狀與痛點,本期我們以媒體行業為例,深入分析大資料在媒體行業的應用。

先來看一下媒體行業工作流:

大資料在媒體行業的應用——《企業大資料實踐路線》之二

新聞工作者先産生一個内容,形式可以是文字的、視訊的等,無論你是編輯還是記者或者說是美編,或電視台的采編人員等等所生産的内容都會存入到業務資料庫裡面,業務資料庫通常存在我們内部機關的機房裡面,媒體行業也同樣,再小都會存放到自己的機房裡面,都有自己的業務資料庫,把業務資料存入資料庫之後呢,通過管道把資料傳輸出去,比如說通過網站、直媒的管道、移動端管道、電視台視訊的管道等其它管道出去,這些管道出去的東西被觀衆、讀者、聽衆所擷取後産生回報,或無回報,但最終資料都會被特點的人員即統計人員進行統計。如果說是直媒,它不像電子媒體有收視率,閱讀量的概念,但直媒會有甄别能力的資料量,可以在系統裡面或者是企業内部的甄别系統裡面查到。資料又分散在不同的系統裡面,甄定有甄定的系統,網站有網站的CMS,視訊有專門的視訊點播系統,APP有APP的用戶端,新媒體有新媒體的用戶端,如頭條等其它媒體管道,這些大部分資訊都是由我們的統計人員把它們重新合并、歸類放到我們自己的企業如報社、雜志社内部去進去分布的。這個過程需要繪制一張統計報表。

1、 看了一個報道在報紙上看到的

2、 看了一篇新聞在電視上看到的

3、 網站上看了一個視訊,這個視訊多少分鐘,講述了一個什麼樣的事情

看到的這三樣東西,可能表現形态是不一樣的,但在整個的新聞機關内部,是有一個起始點出發的,從某一個新聞線索出發延伸出來的三條資料,把這些擴散傳播出去的資訊反向回收回來,再跟這三條線索關聯和綁定:

一是通過這樣的關聯和綁定去解析營收,可以具體去看到是什麼樣的新聞,什麼樣的文章更容易得到讀者的喜歡,或什麼樣的内容下它的廣告效果會更好。

這些營收的解析都是通過我們的統計人員反向解析後繪制出來的報表來解析我們的營收這樣一個過程。

二是績效考核。績效考核主要是針對我們的記者、編輯、新聞從業人員、美編、電視台的采編人員這樣一個績效考核,這個就會關聯到年終獎,月度季度獎金都會有一定的關聯。

這就是我們傳統媒體整個的一個工作流程,從開始介入工作到最終出績效考核,得出的一個全流程的概覽。

流程版的工作流:

大資料在媒體行業的應用——《企業大資料實踐路線》之二

人肉方式跟進傳播路徑:這裡的路徑比如說傳播到了微信,或者是傳播到了某某網站,傳播到了電子刊物、電視台等各種各樣的新媒體。

通過粗淺的分析大緻了解傳播效果:這裡為什麼會是粗淺?人肉的跟蹤方式一定是不會有很好的效果,因為它有時效性,統計的時間節點,各平台的傳播路徑産生的回報結果是不一樣的,比如說有一篇文章,放到了今日頭條裡,今天下午3點去統計,它的閱讀量可能隻有1500,但你把這個數字記錄下來後就沒了,但你明天再來看,可能晚上特定标簽的使用者在晚上9點鐘批量的閱讀,這類人就愛看你這種類型的文章,這樣可能就會有一個爆發式的增長,就會有2萬次甚至是5萬次的閱讀量,這樣前面統計出來的1500次由于時效性的問題變得極其不準确,這是第一個時效性帶來的問題。

第二個就是傳播管道太多,人力有限,通過人力基本上是無法100%覆寫的,大部分的人力統計都是肉眼去識别、去記錄再彙總的EXCLE裡面,或者有更進階的方法,半自動化的方式抓取,通過爬蟲去抓取一些電子版的一些閱讀量、評論資料等等。不可避免的是管道的限制,以及轉載轉發的限制,無法很全面的收集回來,這是傳播效果遇到的最大阻礙。

總結:

1)時效性

2)管道覆寫面

通過内容付費或增值業務産生營收:比如本身就是通過付費來看的,或者是通過一本出雜,這本雜質是要買了才能看。或者說你的内容是免費的,但裡面有一些像廣告業務,或者是幫助其它公司做了一些PR的品牌宣傳,通過增值的方式産生營收。

粗放的進行績效考核:由于前置流程比較粗,是以這個考核一定是不全面的,對員工不公平,或者過度發放績效,明明沒有那麼好的價值,通過直覺感受來評定績效考核的标準,這就會産生一個粗放的績效考核。

從上面的圖形版到流程版,除了不精細的問題外,好像沒有什麼很緻使的錯誤在裡面,以前我們做媒體行業,也是這麼認為的,湊合用,沒有出現什麼惡劣的後果,但目前在我們這樣一個時代裡,競争對手都在往前跑,我們也不得不往前跑,對此我們就分析了一下,拿到了一個點告訴媒體行業客戶問題出在哪裡。

下面這張圖可以看出一個正常的媒體工作流應該有的樣子。

大資料在媒體行業的應用——《企業大資料實踐路線》之二

圖的前半部分是和我們上面講到的一樣的,但是從傳播管道開始,你的資料就開始脫缰而出,不受控制。

大資料在媒體行業的應用——《企業大資料實踐路線》之二

這個過程就有了人,做了機械的事情以及不準确的事情,接下來的操作,統計,營收,績效都會由于依賴于不準備的統計資料,就像導緻後續所有環節都出現問題,這個過程最大的問題在于人為進行資料收集的關卡沒有做好,導緻資料脫缰,不受控制。人為會存在很多客觀,主觀等各方面影響,就會容易出一系列的錯誤,但往往又最難控制,最難管理。

在整個工作流最重要的三個環節之前加入了一個不靠譜的人來完成這樣的工作,是以讓自己的整個資料環境應得很不安全,這也是在和客戶進行問題進行中總結出來的一個概念,傳統媒體是這樣一個情況和現狀。

改造完之後的狀況又是怎樣的呢?

看一下下面這張圖,一個前沿媒體的工作流程:

大資料在媒體行業的應用——《企業大資料實踐路線》之二

還是通過采編人員去創作内容,之後通過近期的熱點、讀者偏好進行定向化或者有權重的創作,創作完成後進行智能核對及智能排版,這樣一個過程,像媒體行業都有三審三校的過程,防止出現大的疏漏,像錯别字、書寫錯誤、拼寫錯誤等,可以通過比較智能的校對工具或者是校對過程,以及一個比較智能的排版過程解決這些問題,當這個問題解決之後,才會把一個比較标準的内容入到内容庫中,進一步進行内容傳播,内容傳播後分到不同的管道。

現在變為千人千面的推薦内容,推送給相應的讀者,這個模式很像頭條,或者是新聞版的淘寶,每個人會看到不一樣的内容,伴随着每個人閱讀的資訊越多而差異性越大。每個人的閱讀習慣以及行為都不同,不同程度的閱讀時間積累之後把握到你感興趣的資訊點,給你推薦你喜歡的資訊。

當你把資訊推送給讀者之後,就會産生各樣各樣的資料,比如像我們的傳播資料,如一段視訊、 一段聲音,傳道到不同的管道媒體(頭條、網易新聞、網站以及APP)上等,這個傳播的資料是需要記錄下來的,以及閱讀的資料,比如某某某什麼時間閱讀了什麼文章也需要記錄下來,還有行為資料比如在閱讀或者是觀看資訊的過程中産生的一些行為,最長見的像評論點贊、視訊發彈幕,這些是比較基礎的,還有更深層次的,像在這個過程中産生的分享,或者是看了幾分鐘,或者是跳行等都是行為資料。

這三類資料我們把它彙總到我們的大資料池中,之後就進入到下一個流程:通過内容付費或增值業務産生營收。這一步是沒有變化的,你用不用大資料,它都是這樣沒有任何的改變,比如說方式都是固定的,但是可以通過創作人、作品口碑、題材口碑等要素形成決策報告。

在上一個環節中,我們說到的最主要的問題,用來做決策的東西的前置資料比較粗糙、雜亂,以緻于沒有辦法提供一個強有力的資料支撐。這個環節來解決這個問題,通過創作人、作品口碑、題材口碑等要素做一個決策報告出來,這個決策報告就比較直白的告訴管理層或者是決策層。某某創作人最近30天創作了多少篇内容,每一篇内容又是怎樣的閱讀情況,甚至可以再細分,什麼樣地域的人或者是什麼樣标簽的人更喜歡某某創作人産生的什麼類型的内容。

作品口碑就是針對特定的内容,比如說一部影視作品,一個資料報告,把所有和這個作品相關的各個緯度相關的資訊彙總起來,進行清晰,介紹,介紹完之後進行總結報告,每一類的題材都可以通過資料分析他各個緯度形成資料報告。

拿到決策報告之後,就可以通過決策報告驅動内容創作。比如說某個創作人杭州人比較喜歡看他的内容,就可以通過資料報告把這些資訊展現出來。除此之外,還可以拿來做更精細化的績效考核。