天天看點

陸奇:數字化的本質

疫情期間,在每日的跑步過程中,聽完陸奇的一門混沌課程《數字化浪潮與創新機會》。

這門課,我聽了三遍,或許因為不夠聰明,有些地方不甚了解,就帶着問題再聽一遍。

陸奇提到的一個思考方法,來自Richard Feynman,1965年諾貝爾實體獎得主,被認為是愛因斯坦之後最睿智的理論實體學家。

For things I do not konw how to create it I do not understand.

他是說,如果有件事情我沒法建立它,我就沒法真正了解他。

他的建立,不是真正的實體上的建立。對任何一個複雜體系,如果你想得深,你把它拆解成子問題,對拆解到一定階段以後,對每一個子問題想清楚之後,去跟大學大學生(非專業視角)交流,如果大學大學生能接受,他就認為這個子問題的答案是成立的,然後把所有子問題的答案,組裝成對原來問題的解答,這樣的話就變成一個結構化的思維。

你可以按照這個方法,對任何一個複雜問題,都可以想的更深,看得更遠,這是分享一個簡單的陸奇常用的一個思考方法,也是我深以為然的方法,我用這個方法給很多人講企業資料營運體系的建構。

沒想到,今天聽陸奇的課,不僅采用了大緻一樣的方法,并且,對數字化的了解,我們拆分出來的本質過程竟然趨于一緻。

起點學院的很多同學聽過BLUES講的這門課程《資料驅動産品疊代》。

什麼是數字化的本質

我們每天都講數字化産業,那麼什麼是數字?

數字化的核心要素有6個組成部分,缺一不可。

第一是擷取資訊,對某個自然現象或者社會現象。BLUES的了解,就是資料源是什麼,資料從哪兒來,如何産生。

第二是表達資訊,用某一種簡潔的,可以用來計算用的一個表達方法。BLUES的了解,這裡是資料的定義和描述,例如在做數字化的時候,就是做資料的名額定義,資料名額體系的建構,公式定義。

第三是存儲資訊,把表達好的資訊存儲在某一種實體媒體上。這個比較好了解,就是建立資料存儲機制,按照一定的存儲規則,建立資料倉庫、資料湖,建設資料中心,進行資料存儲。

第四是傳輸資訊,用某一種傳送機制(transport)來傳輸資訊,就是資料從資料源傳輸到資料存儲系統。

第五是處理資訊,這是最核心的,通過計算的方法來進行針對性的處理,針對某個任務,針對人類的某個需求進行處理。

第六是傳遞資訊,将處理好的資訊傳遞給端點(end-point)來達到目的。

概括一下,就是下面的這個表格。

聽到這裡,我當時是在跑步機上跑步,不由得笑起來,大道相通,我做了十多年的數字化工作,也是契合了這六個本質,後來總結了自己在騰訊、YY語音、迅雷等公司做資料營運的經驗和方法,最底層的邏輯,就是這六個核心要素。

來看看BLUES做資料營運分享課程的三張PPT頁面。

第一張PPT,是2009年,BLUES在騰訊做資料營運時候,上的一門資料課程,将資料系統分為:資料源、資料傳輸、資料存儲、資料計算、資料表達、資料應用,六大部分,和陸奇的提煉幾乎吻合。

第二張PPT,是亞馬遜的物聯網、大資料和人工智能技術的內建系統,從六個本質來看,一樣是契合的,資料源變得更多樣,包括了交易資料、ERP資料、日志資料、連接配接裝置的物聯網資料、社交媒體資料等。

通過采集接入傳輸,經過資料ETL清洗,流入資料湖進行存儲,黃色框内是資料處理分析計算,然後提供資料服務,最後到資料應用子產品,提供給資料科學家、資料分析、業務使用者、客戶支援平台,自動化/事件管理。

第三張PPT,是騰訊2016年時候的一張資料系統架構圖,一樣的契合陸奇提煉的六個要素。

左邊是當時的七大事業群,資料擷取來源于各個事業群的産品,例如線上消息、離線檔案、DB-Binlog等。

資料進入騰訊資料系統的TDBANK(實時資料接入平台),這個部分負責資料的傳輸,包括格式适配、加密傳輸,然後進行緩存分發。

資料存儲部分是TDW(分布式資料倉庫),由查詢引擎、計算引擎、存儲引擎構成。

實時運算系統(TRC)進行資料的實時處理,秒級的計算,應用到實時精準的個性化推薦平台。

大家可以注意到,這六個要素,陸奇說第五個處理資料,是最核心的,是展現數字化效率的最重要的部分。

對于很多傳統行業,要實作數字化,最基礎的,最難的,其實是第一個部分,資料擷取,也就是資料源,這個難,不是技術的難,而是人,是思維方式的難。

傳統行業,很多時候,是單兵作戰,沒有特别高效的協同能力,看起來也能獨立存活,即使沒有數字化,自己單店經營,貌似也活得不錯,是以,将一個事業做大,尤其是原來這個傳統行業就做的挺大的,而且也沒有借助特别高效的數字化手段,那麼原來做這個行業的人,就對數字化有排斥感,就是不需要什麼數字化,也可以活,至少目前可以活。搞數字化,反而是投入大,産出小的一件事情,至少,在他們在任的這幾年,數字化不一定能馬上發揮作用。

這也是一種事實,數字化的過程,是需要積累的,資料從産生到積累,存儲到運算,到算法的不斷完善,機器學習的不斷深入,計算的速度逐漸提高,數字化的效用才逐漸展現。

人類曆史上的三大财富創造體系

第一是農業體系。農業體系的核心是通過利用土地和光合作用來創造财富,在這個階段,人所需要的隻是簡單的工具,并不需要處理大量的資訊。但是限制也很明顯,那就是産量基本取決于土地的大小,産出效率是比較低下的。

第二是工業體系。工業時代是财富創造的第二曲線,它用的是化學能源,采用電力傳輸的方式,大規模的整合了人的技能。為了更好地融入工業社會,我們需要在大學學習專業的技能,然後參與到社會分工中去。本質上說,工業時代依靠的是化石能源和人的技能。

第三是資訊與知識體系。從圖中可以看到,在這個時代,财富創造的速度遠遠超過工業時代的增長速度。本質上講,這個時代,創造财富的核心驅動力是通過資訊、數字化在資訊當中抽取知識,用知識不斷重組人類社會的現有資源,最終實作财富的快速創造。大家可以回顧一下20年之前全球最大的10家公司,基本上都是石油、汽車企業。而現在,高市值公司基本變成了高科技公司,他們創造财富的核心能力是數字化。

數字化與智能商業

聽完陸奇的課,就想起去年看過的阿裡副總裁曾鳴的一本書《智能商業》,非常通俗的講述了阿裡的數字化過程,也就是智能商業形成的過程。

未來商業的核心有三個要素:

(1)資料化:以資料方式,記錄使用者所有的操作行為。

(2)算法化:根據資料,提出優化的算法模型。

(3)産品化:和客戶直接連接配接,形成回報閉環,進一步提高算法能力。

首先是資料化的效率在很大程度需要線上化,通過移動網際網路、物聯網讓交易過程每個環節線上,提高資料産生的效率,然後形成網絡化,各個部分之間産生網絡連接配接,資料互通,最後一個階段是智能化,基于前期大量的銷售資料、使用者行為資料、交易資料,形成智能算法,讓商品的搜尋結果更加精準,讓商品的推薦更加個性,機器比使用者更了解使用者想要什麼,真正做到淘寶的千人千面,并随着資料的不斷流動,形成資料回流,完成了淘寶的資料閉環建構。

在企業數字化程序當中,要走向商業智能,企業必須拷問自己四個問題:

(1)企業是否最大限度實作網絡化?

(2)企業能否盡可能的引入機器的學習效應?

(3)企業能不能在網絡擴張的過程中,盡可能用機器決策取代人工決策?

(4)企業能否讓自己收集的資料與更多不同類型的資料進行交換?

這四個問題,就契合了數字化的六個組成部分,網絡化讓資料擷取和傳輸和存儲更加高效,機器學習讓資料計算更加智能,機器決策取代人工決策就是數字化的傳遞成果。企業讓自己的資料與更多不同類型的資料進行交換,就是讓資料的擷取、資料處理更加開放,更多的資料會讓機器學習加速自身的完善。