天天看點

高陽:資料決策的藝術

2015 年 12 月 17 日,SegmentFault CEO 高陽作為演講嘉賓,出席北京易觀智庫資料驅動創新峰會。易觀智庫董事長兼 CEO 于揚做了開場演講,到場嘉賓來自易觀智庫、工商銀行電子銀行部、東方富海、愛奇藝等網際網路企業。

高陽:資料決策的藝術
高陽在主會場做了主題為《從開發者到創業者:資料決策的藝術》的分享。通過滴滴路線推薦、霧霾天銷量最高的産品的案例展現資料分析的奇妙之處,目前市場的資料現狀,以及 SegmentFault 是如何透過資料分析做市場決策。
高陽:資料決策的藝術

高陽的演講内容如下

大家好。今天很高興過來跟大家分享我的一些觀點,把我放在這個位置,可以說特别的有意思。我發現每個不同的行業,最後大家得出來的結論,往往是驚人的一緻。每個人都有看待這個世界的一套方法論,我也有自己的一套方法論。

我看着不太像 90 後,其實在這個行業已經做了 7 年。從北京去杭州創業,我經曆了兩家創業公司,我在大學隻待了三個月,跑到北京和同學創業了。我個人就是這個資料時代的受益者。因為我發現當時在學校裡擷取知識太慢,我自己大量的知識是通過網際網路還有人所産生的有機的資訊,我可以以更高的速度和效率擷取。

舉個例子,大家覺得一個資料想的比較抽象,但是我覺得現在來說大家都是資料的受益者了。像百度地圖可以實時看到現在的交通狀況,這就是大資料優化我們生活服務的應用案例。同時,我有一個自己實際的體會的案例。之前聽過滴滴技術負責部門的業務邏輯,滴滴打車從我家到公司有 N 條路可選。我知道最近的一條路,讓滴滴司機走這條路,而這條路基本沒人知道的。我坐了十次,滴滴資料平台就回報出來這有一條更近的路。這就是資料時代不斷優化改善我們生活的場景的一個案例。

當大家看資料有特别多好玩兒的現象可以去傳播。不知道大家前段時間有沒有看到一個資料的例子經常網上傳播,大家覺得跟我想的不一樣。霧霾天的時候什麼賣的最多?是口罩嗎?實際上,最後調查結果竟然是安全套加運動裝銷量最多。

大家越來越多發現到資料的價值,導緻有一個行業越來越受到重視,就是本身的資料分析行業。我的很多做開發者跟技術的朋友,他們很多創業就去做底層的資料支援和資料分析的工具,讓很多行業怎麼更好的,更快速的去運用他自己的資料。

我們自己做的行業也是針對開發者使用者的行業,我們用了三年多的時間,現在聚集了行業内一百多萬的開發者。當然現在網際網路行業當中,很多創業者本身都是技術和工程出身,包括現在這些 BAT 行業級的大佬,絕大部分分比例是技術和開發者出身的。但是我發現幾乎百分之百創始人是做技術出身的。而且這些行業都跟資料相關的,也跟整個資訊産業相關。像做雲存儲,開發者工具,開發者服務,所有這些東西都是為其他服務去助力的。

每當我們講到一個新的時代的時候,這個時代最早進去的那群人,他會成為這個時代的助力者,這個底層平台建設者。我們現在越來越多開發者投入這個領域,建構數字領域的生态。做底層的雲存儲,現在可以用更低的成本造一個新的産業出來。之是以資料越來越多被讨論到,就是因為存儲資料的成本降低了。

前幾位嘉賓講了資料在行業非常重要,有很多新的趨勢。到底大家應該怎麼組建自己的團隊呢?怎樣應用這些資料呢?我會講一些更理性的邏輯。在這之前我先講一下我了解的這個行業的分析。我發現實際上這結論跟前面的幾位嘉賓的結論是非常一緻的。

中國非常有意思,它現在處在幾個行業領域交叉的時候。美國像基礎的硬體、傳統行業在不停的發展,非常長的一段時間;十年、二十年的時間發展它的資訊科技、網際網路。但是你可以想想中國整個行業是在 2011、2012 年迅速交叉的。尤其網際網路進入以 PC 網際網路為基礎的非常成熟的技術理念。加上 2011 年很多裝置和産品更新之後,使得整個網際網路的邏輯,就是去中心化,更扁平,産生更多的連接配接。我認為未來幾個産業,我個人感覺有兩個大的方向:第一,所有的相對網際網路的邏輯,它會越來越多的垂直化的去發展。第二,傳統行業跟網際網路一起接軌的時候,這個可能才是下一個巨大的金礦,在這個領域裡去産生。

現在大家其實已經看到了,很多傳統行業在運用網際網路這套邏輯跟規律,讓它行業怎麼産生更快的效率的疊代。基于這些邏輯,我發現所有的,不管是行業還是怎麼也好,這些東西越來越垂直化的發展下去。因為在移動網際網路和 PC 網際網路時代,大的平台邏輯相對來說已經非常完善了。在這個時候我有機會但沒有資源,也不會是撬動一塊巨大的蛋糕那麼難了。我可以以非常小的領域切入。我覺得未來的公司有三個屬性:一個,公司它要有文化屬性;再一個,這個公司要有媒體屬性;第三,這個公司要有資料的屬性。就是它是三種類型的公司。

以後一個品牌,你隻是生硬的品牌,我根本不會關心你。你得有自己的理念、文化去傳遞,去跟你的使用者一起創造你們的品牌,而不僅僅是生硬的獨自創造品牌。最牛的社群的标杆是什麼呢?就是宗教。你發現很多企業,它的文化屬性,它有大量的粉絲,那是因為它有認同的理念是存在的。比如說為什麼所有的人都樂于去用蘋果的産品呢?因為通過這樣一款産品,它反映了是這個人可能精神内在的,其他方面的屬性。你的品牌能不能産生這樣的關聯?

垂直化的整個邏輯,它是滲透到每個不同的行業當中的。而且在每一個垂直領域當中,你的文化需要去傳播,你必須讓自己變成一個媒體。你可能不僅僅要依靠外部的媒體。我認為未來的媒體不單純的隻是一個媒體了,它也會變成一個資料公司,它對前端聚集了這個行業,這個領域巨大的資料。

我是 08 年創業,做社交遊戲,那時候我們隻有三個人。我們差不多十個人左右的時候,社交遊戲流水已經超過一億人民币了。我們怎麼做到了?我們用大平台開放政策,我們從 Facebook 和其它大的平台上,你發現大的平台想什麼事都隻有不可能了,它要開放自己的陣營。這就是 360 和 QQ 大戰之後,QQ 開放了平台。大的公司有時候不僅僅是自己主營的業務牛,而是在你的平台當中,有多少隊友,這些隊友有多少是上市公司,有多少是公司在你的平台上誕生。

其實最近又有一個趨勢,大家想阿裡為什麼收了這麼多媒體公司,它在小領域的領頭公司要投資呢?其實就是這個邏輯,因為在它大平台上所有的資料,都是支撐每一個行業裡最前端的領頭羊,它前端的領頭羊又能結合它的資料更好的服務它的開發者,然後建立這樣的矩陣聯盟。

基于這樣的背景,我認為産生了為什麼大家今天來到這裡去讨論所有的資料的意義。因為所有的背景,你可以更便捷的搜集資料。當然這裡有一個我漏掉了,就是越來越多的人通過智能裝置,各種各樣的,設定傳感器,還有 N 多的裝置去産生資料。産生的這些資料通過比特的形式去存儲下來。後來又經過分析師把比特的、大家看着特别高深的東西轉化成實用的資訊,以後資料和資訊也會越來越快的傳遞和傳播。這是基于我上面說的這些邏輯。

接下來我講一些實際的,如果我們每個人抽象的講的話,每個個體到更大的個體,就是一個企業,一個組織,大家每天都在處理資料。你今天聽到的這些東西,有些數字你很敏感。其實到你沉澱下來、它對你有用,你已經做過處理了。資料可能是一些雜亂無章的,它可能是數字連接配接起來的資料。但是它怎麼樣成為資訊呢?它要經曆一個過程,它需要在這個過程當中去篩選出來,成為我們有用的那些東西,它就叫資訊。其中每天都在接觸各種各樣的資訊,自己都産生這樣的判斷。

一個大資料資訊它會經曆,我認為尤其跟網際網路,我可能偏網際網路邏輯去分析的。一個資料最終對我們有用,我們基本會經曆這樣幾個過程。其實在原先存儲資料成本高的時候,很多企業資料存儲就流失了。但實際上這些東西是一個公司的,對現在來說是一個很重要的資産。我能從資料當中去分析出對我有用的東西。先要去資料挖掘,然後再去分析這些資料,你要建立适合你這個領域的數學的模型。就是說資料到怎麼能用我覺得要辯證的去看它,因為大量資料中有很多垃圾資料是對你完全沒有用的。在一開始的時候,你要先去最終在這個過程當中你要驗證你的資料,最終是不是有用的,然後跟你的人為的去溝通,成為你的決策。就像剛剛提到的模型,看到的電影票房是這個樣子,但是按照傳統經驗的話就花錢去買了,其實效果是很差的,它最終會形成這個決策。

一個比較簡單的分析模型,國際上有很多大的公司,尤其是矽谷的公司,它們已經有自己比較成熟的分析團隊,像 LinkedIn、Facebook 等等,他們資料分析團隊已經成為獨立的團隊。像國内其實有很多中小型企業,大家資料分析團隊有的放在技術組,有的放在營運組,全是散落的。我認為一個資料真正有用,對一個企業分三個層面:一、助力,就是推動你自己業務的成長。這個資料對你是不是有用的,它能不能給你的業務帶來新的成長?還有在檢驗的過程中不斷優化你自己的業務?再一個,我一開始舉的例子,其實很多人發現霧霾的時候不是口罩賣的最多,是安全套和運動裝賣的最多,這個是不是對你有價值啊?就像剛剛我看到了上位嘉賓,易觀的同學分析了整個行業,我發現有一個對我非常有用,而且是我最了解的,我這個行業當中有很多人做這個,就是企業服務。我發現好像那個裡面是增長非常高的,百分之十八點多的增長點,比其他行業增長非常非常多。這個其實我看到這個資料我已經知道這個決策了,因為很多 VC 投這個領域的重點,很多開發者他開始去建構企業服務,原先這個市場不成熟,它有越來越多的人去做,當然有資料支撐,可以讓我們更相信我們可以把這個事做下去。

這是剛剛說的資料最後跟自己的核心的平台的邏輯。剛剛已經講到了,就是你自己的使用者不斷的增長,其實你的資料量也會不斷的增長,你的使用者分層、使用者的不同的模型,都可以展現在你不同的資料當中了。不同的分層的使用者你怎麼樣營運它?你怎麼樣維護它?可能就要展現在你自己提供的産品之上才能實作,就是說要符合你的産品需求和服務。

資料團隊為什麼在我們一開始的時候就特别重視呢?我跟我兩個合夥人,三個都是工程師出身,都是技術出身。我兩個合夥人,我們都有資料的邏輯,産品的邏輯,可能我後面更多的參與到公司的營運各方面,我們也會想到很多資料對它的支撐。其實資料它不單單就是像說的那種,數字很簡單的東西。最後它分析出來的結果是可以支援到你所有團隊去做決策的,包括營運以及怎麼更好的銷售你的産品。當然現在還有一種現象,就是經常發現很多垂直領域的公司,它越來越多去分享它的行業的資料報告。資料報告變成了新的傳播和營銷方式。因為大家對數字很敏感,我要了解這個行業我就要看一下這個行業的資料報告。

我們去建立我們資料團隊的時候,它不單純自是分散在各個部門,我們把它做成一個新的單獨的部門,但是這個部門的人,一個資料分析師可能要具備多方面的能力,就是他要有一定資料挖掘,最底層的話要有資料和工程的理論,資料分析要對資料模型,數學相關的,要建立這樣一個團隊。同時我會要求所有做資料的同僚要深入到業務當中,如果你做出來的資料模型跟我們的業務千差萬别的,你的資料是無用的。你要懂點業務,又懂你的産品,還要懂你的行業,同時具備分析能力,這些才是一個完整的。

其實可以想想來說,我認為很多公司,可能現在都沒法兒做到,除非這種 BAT 大公司,它們有健全的資料,很多小公司做不到這點的。要是做的話,可以現在慢慢按照這樣的思路整理你們的邏輯和做法。同時因為很多人做不到,我認為這就是巨大的商機,像易觀有很多資料産品,是可以支援到你的。你可以一開始不用建那麼龐大的團隊,就可以把其中一部分事情去做了。這裡面就變成了新的邏輯。

如果你是做技術的可能知道 SegmentFault 這個單詞,如果不是做技術的可能不知道這個單詞是什麼意思。其實它是技術裡面寫代碼報錯的時候的一個錯誤。就像我們做我們這個領域一開始,我的領域的使用者是程式員、開發者,我們就選擇了他最懂的單詞。其實我們衣服除了程式員最喜歡,HR 也特别喜歡。他說要招程式員,多給點我這樣的衣服穿穿,可以拉近跟程式員的距離感。

舉一個例子,我說一切從挑戰開始。我們在光棍節做了一個 “程式員闖關秀”的 遊戲,一般都能過去兩關,到第三關肯定是過不去的。因為這個遊戲太厲害了,隻有程式員懂得玩兒,最後他們把連接配接轉到百度貼吧等等的,說這兒有一個太變态的遊戲了,有沒有大神破解它?最後所有人得出來的結果,我們裡面設計了很多營銷和邏輯的環節,我們最後反編譯出來的代碼是一張照片蒼老師。我們在連續一周沉澱了好幾萬使用者。之前每天隻有十幾個使用者的增長,不到一百個,到這個遊戲激發了大量使用者,對我們使用者群有了更多的了解,這群人喜歡挑戰,他們喜歡技術上的挑戰、分享跟交流。

我們基于我們的産品按照同樣的邏輯做我們的産品。我們現在其實很簡單,就是作為一個開發者的技術的分享交流的平台,當我們産品不斷演變的邏輯,你可以了解我們是一個程式員的豆瓣、程式員的 Facebook、程式員的知乎。我們聚集了一百萬開發者,我認為開發者這群人是網際網路第一生産力,他們是走在最前面的。我們一開始我們平台是不賺錢的,我們一直堅持做這個,後來 IDG 資本投資我們,他們想的比我們更長遠,我們開始想的做一個程式員社群。現在聚集了不僅是一百萬程式員,而且聚集了一百萬的程式員所提供的服務跟他的生産力。我們做了很多有意思的線上線下的事情。

後面我們發現,在我們自身成長的這三年多當中,有很多做技術的人去創業了,而且做的非常好。我可以從另一個邏輯上想,我們又成了一個新的技術創業者,虛拟孵化平台了。

我們就在想我們怎麼樣把我們整個商業邏輯,從最開始的技術交流,到這群人技術的成長,他怎麼樣找工作,到這個人怎麼樣用自己業餘的時間給其他的企業提供他的服務,到這個人能力非常強,要去創業了,我們提供了這樣一個生态的邏輯跟環節。在這個過程當中,資料在不斷的伴随着我們公司的成長,也越來越重要。就像我們作為一個垂直領域的代表,我認為像我剛剛說的,我要有文化屬性、媒體屬性和資料屬性。很多 VC 投資我們相關領域的時候經常給我打電話,說這個平台值不值得投資,你們這個行業怎麼發展的?

其實我們有大量資料支撐,我認為這個可以投的,這個公司跟我們合作的,這個資料不僅帶來我們自己産品的價值,我們看到這個平台的趨勢發展,給我一些朋友提供建議。還有就是我們有自己的極客文化,我們聚集了很多熱愛程式設計,願意從把比特翻譯成有價值資訊的工程師,這群人本身的價值和文化。還有我們不斷傳播這群人的文化。雖然他現在可能是整個網際網路行業當中一個小小的亞文化,可能最後就像原先美國總統說的,人人都有可能學程式設計。他就變成了一個更主流的文化,去帶動這個行業的發展。