天天看點

TalkingData 崔曉波:信仰資料的人做的決策才是資料驅動的

一年一度的 TalkingData 智能資料峰會,已經成為 TalkingData 向世界展示其真知灼見的最佳視窗。

雷鋒網了解到,如今,所有企業無一例外的面臨着數字化轉型帶來的挑戰和機遇,而 TalkingData 的多年前通過為移動網際網路開發者提供 SaaS 經營分析服務起家,從資料的采集、處理到資料的分析,再到資料的應用與咨詢,已經形成了一套以“智能資料平台(SmartDP)”為主的完整資料應用體系,構築了一套以資料商業化平台、資料服務平台,及資料合作平台為核心的資料生态。 TalkingData 的戰略轉變不斷讓業界耳目一新,更日益形成 TalkingData 洞察趨勢、判斷産業、繼而為更多合作夥伴主動提供解題思路的新模式。

雷鋒網(公衆号:雷鋒網)知悉,近日 2017 TalkingData 智能資料峰會隆重舉行。TalkingData CEO 崔曉波在演講中說:本次大會是智能資料峰會,就是要探讨智能與資料的關系。如今我們所有人都感覺到世界在變、社會在變、技術在變,我們今天就是要跟大家講如何用資料的方法去洞察世界的變化,以及應對世界的變化。

以下内容由雷鋒網根據崔曉波演講速記整理(有部分删減):

我們今天的主題是知機識變、有唐之盛,來這個會場之前我們都發了一個很酷的邀請函,很多朋友給我發來了賀信,說你們的邀請函很酷,清明上河圖裡面的人都活動起來了。我們今天的話題就想讨論一下,因為我們所有人都在感覺好像身邊的世界在變、社會在變、技術在變。由于技術的高速發展,我們帶來的各種各樣的商品,已經由稀缺變得比較富足了,消費者的選擇變得非常多。其實我們消費者也在變,90 後、2000 後在随後十年裡就會主導市場。我們了解變化、了解客戶、了解消費者,我們今天要跟大家如何利用資料的方法去洞察這個世界的變化,以及應對這個世界的變化。這兩天我們準備了 100 多個演講。希望能夠給大家帶來不同的角度和思考。

在過去的十年裡面,中國的變革主要推動力是什麼?是移動網際網路、物聯網。我們仔細去看過去六年的資料可以注意到,不管是移動手機的數量,還是爆發的物聯網領域,還是可穿戴裝置的增長都是指數級的,不是一年 10%、20% 的增長,更多是成倍成倍的增長。但是這種趨勢,其實大家并沒有意識到。

随着去年到今年人工智能技術(特别是感覺計算,計算技術)的高速發展,整個世界數字化的速度在加快。我們通過人臉把模組的一些特征開始數字化,通過無人車測量街道和城市等等。所有這一切數字的爆炸速度其實已經到了一個難以置信的程度,截至到今天,我們每天産生的資料量就非常有可能達到 351EB。

但是如果我們将來的存儲堆積起來,堆積整個中國的大地都做不到。如果我們的技術不能提高的話,我們就會在一個浩浩蕩蕩的洪流裡面,不知道怎麼取舍,不知道未來的世界會變成什麼樣。

然而大部分人的認知還是線性的,我每天見到小孩的時候,我沒覺得這個小孩樣子變化了。但是如果你突然把時間線拉長,一個月、兩個月你再見到他你會覺得變化怎麼這麼大。實際上指數級增長前面都是有點欺騙性的。因為他剛開始增長的倍數雖然大,但是基數小,大家往往是感覺不到的。

這裡我其實想給大家分享兩個例子,讓大家感覺一下,哪怕是專家也是固守原來的線性思維。20 世紀 80 年代的時候,那個時候 AT&T(美國電話電報公司)請了麥肯錫幫他們做一個決定,那時手機剛剛出現,是以他們要決定是不是要進入手機行業。麥肯錫給出的預測是,到 2000 年手機的數量不會超過 100 萬部,為什麼?因為手機非常的笨重和昂貴。但是實際情況是什麼?2000 年手機就超過了 2 億部。

另外一個例子,2009 年 Gartner 預言,諾基亞的手機和作業系統将在 2014 年統一市場,成為第一大作業系統,将會占據 40% 以上的出貨量。而安卓将僅為 10% 左右,但是實際情況大家都知道,塞班在 2012 年就已經關門大吉了。安卓最後甚至超越了蘋果,成為第一大手機作業系統。

我們仔細分析過這兩個案例,我們發現,這些專家手裡都有大量的資料證明,那個時候不管是手機,還是智能作業系統的增長都是指數級的。但是為什麼還是會做出一個每年增長 10%、20% 的預測,這就是因為人的思維其實是線性的。

那麼,舉一個正面一點的例子,基因測序的例子,1991 年人類決定啟動一個宏大的計劃,就完成整個人類的基因測序組,這個計劃整體投資了 60 億美元,預計耗時 15 年。這意味着什麼?大概應該是 2005 年能夠把這個測序完成。但是實際情況是,時間過了一半,1997 年的時候整個測序的工作隻完成了 1%。

那時候很多專家說花了這麼多錢,但是這個項目肯定是失敗了,肯定測不完。但是有一個人發現了一個規律,每年完成測序的數量是呈指數級增長的,最後實際情況是什麼?大概花了十年左右,整個測序工作就完成了,預算隻花了整體預算的一半,30 億美金。

發現這個規律的那個人是誰?就是奇點大學的創始人。是以大家一定會覺得,這兩個例子好象離我們很遠,但是其實不是,因為在我們服務我們客戶的過程當中,天天都可以看到這樣的例子。會有很多客戶說應該是這樣,但是我覺得應該是那樣,你必須把這個資料給我調整,對不起,這不是 TalkingData 應該做的。我們的客戶應該是相信資料,信仰資料的,隻有信仰資料的人和企業做出的決策才是資料驅動型的。

這種決策往往也是指數級的,這會貫穿我們今天所有的演講。這是我今天跟大家分享的一個案例,讓大家有點感覺。

看一組資料,人類的習慣在被改變,購物 70%、社交 100+ 分鐘、外賣 2.87 億、出行 30%。我不知道大家感覺怎麼樣?大家是不是感覺還不錯?好像是這麼回事,我看起來這個資料還挺舒服的?但是坦率的說,如果大家看到這組資料的時候沒有異樣的感覺,你們的思維就是線性的,這就是我們以前研究市場、研究消費者慣用的方法,因為我們已經習慣了用一種片面的、基于時間切片的、基于很小樣本量的、基于非常弱的論據做出很多決定。

是以我們在過去五年裡面,從企業、政府、各種各樣的組織觀察到的情況:他們隻要看到這樣的資料就做出一個非常大的決策。但是這真的是我們指數級的社會、世界裡面應該采用的洞察的方法嗎?當然一定是 NO,一定不是。那種方法是什麼?如果我們面臨這樣一個世界,是在指數級變化,不停在變,但是我們收集資料的能力、速度、次元已經達到前所未有時代的時候,我們怎麼了解這個世界?我們認為我們看世界的角度會發生很大的變化,我們以前看世界是由實體物質化,會向個數字虛拟化的方向去轉變。

大家可能不太了解這句話,但是我可以給大家分享兩個案例,因為大家都知道谷歌在做無人駕駛,我們參觀過還是挺震撼的。它為了做無人車,放了很多勘測裝置,包括無人車本身,然後在一個城市裡面不斷的收集資料,為什麼收集資料?是因為避障嗎?為了做模型嗎?都不是,最後我們發現數字化的城市,他們把所有的建築、街道、道路、樹木、障礙物,甚至行人都是數字化表示的。

這是最好的方法,在虛拟的世界裡面增強 AI 對世界的認知。我們也非常了解,如果你真的讓一輛無人車上路跑的話,估計跑 10 萬公裡就會碰到故障,因為你怎麼可能讓 AI 迅速了解真實世界,是以我們要數字化、虛拟化,用方法幫助 AI 了解人類。是以這是我們看到的趨勢。

是以,我們研究很多事物的方法和角度一定會發生非常大的變化,在現在的城市裡面,政府其實非常需要一些與人相關的基礎的資料,不限于他們的人工統計學資訊,我們最近和國家統計局合作裡面,包括第七次人口普查裡面都發現有很多的痛點和以前做不到的事情。十年一次普查,抽樣率 1% 到 3%,而且資料是非實時的,我們完全感覺不到一個城市是變化的。基于我們的項目,我們把所有的資料實時化、動态化的來表示,我們開始研究人在城市裡面一天到底是怎麼運動的、怎麼互動的、怎麼社交的、怎麼通勤的,基于此我們會看到一些非常有趣的結論。

第一個結論,最近我們也看到了很多公司做出的一些結果,可以預測人的位置、預測人的行為,準确率百分之多少多少,其實這是不嚴謹的。因為你仔細到城市脈搏的地圖裡面看的時候,你會發現人是有模式的,他在工作日的時候模式非常固定,休息日的時候模式也非常固定,根據我們的模型預算,人有 30% 的時間是完全無法預測的。

為什麼?因為人不是機器人,人有探索性,這是和人的心理學、社會學直接相關的。你去哪玩、你去哪購物其實是非常感性的決定,并不是理性的決定。在做真實世界研究的時候是不可以混淆這些概念的。

時空折疊,傳統的方法看不到時空有折疊,但是你利用實時、可視化的方法把北京所有的人放在一個圖裡,實時的去觀察他變化的時候,你會發現,真的有那麼幾群人,你别看他們地點都在一個區域,但是由于他們的作息時間、生活方式不同,他們生活完全沒有交集,他們都在國貿出現,但是永遠碰不到。這會對城市帶來什麼影響?非常大的影響,按照一個最基本的理論,這個城市會缺乏活力,為什麼?因為不同階層,不同性質的人沒有交集。這對一個城市活力、創新、資源是非常不利的。

人群階層,其實作在城市的誕生都是基于工業化的結果,因為工業化形成的時候,大量的人湧入城市,成為勞工。但是在工業化時代,講究的是中心網絡供給,造成配置設定資源的時候我們就喜歡把所有的資源堆積一起,用所有中心網絡的趨勢分散到這個趨勢。

比如說在北京形成了金融街、CBD、某某學區這種。根據我們的研究,我們利用不同的角度和方法對人的行為進行研究你會發現很有意思,人新的活動方式,生活方式,連接配接方式,他的手機位置,你仔細做聚類,分群研究的話,你會發現分群方法完全不一樣。這是我們用 AI,機器學習的方法自動的把北京的所有人群做了歸類。七類,這是機器學出來的,但是我們的人本實驗室仔細分析他們屬性的時候,我們覺得還是挺符合人的認知的。

這種方法以前從來沒有過,它會帶來城市治理思路的改變,會帶來規劃的改變,會帶來公用設施的改變,我們分布學區、分布醫院、分布各種各樣設施的時候,不能像原來那種南城是一個階層、金融從業人員是一個階層,應該按他們的生活方式來分,這樣城市才是有活力的。

是以,未來我們洞察城市的方法到底應該是什麼樣的?我們推出這樣一個産品——城市透鏡,大家可以看一下。我們會有越來越多的企業會像我們一樣,通過豐富的環境和變化,通過城市透鏡真實對世界可視化呈現,最後把這些觀察和需求,基于 AI 動态模型相結合,在虛拟世界和現實世界轉換中,增強我們對世界的感覺和認知能力。

而這種感覺和認知能力會改變很多商業,昨天和幾個客戶談,如果我們有這樣幾個系統,選址就不需要這樣做了,把選址四個點,實時洞察車流、人流,我可能都不需要很複雜就可以做出一個比以前更真實的決定。我堅信這種技術對地産、零售、銀行、金融、人類、城市都會有非常大的影響。但是我們有了這樣一個面向未來的工具,可以實時的用模拟化、數字化的方式觀察到世界,是不是就夠了呢?根據我們的發現和研究還遠遠不夠。

是以,這是網際網路公司特别容易犯的一個錯誤,網際網路公司做大資料他們研究的是行為模式,他們會推個性化,其實他往往忽略了最重要的,這種形成後面代表着人的心理,人的動機,人的社會學到底是什麼?這就需要很多人的智慧,人現在更了解人。

是以我們推出人本資料實驗室,我們定位是跨領域的開放平台,用資料來了解我們的心智、身體和環境之間的關系。我們堅信即使我們可以用 AI 建立資料模型、了解城市、了解世界,但是人類的心智和情感并沒有就此抹掉,依然是最重要的一部分。我們這樣推動人和人的互相了解,才能改變我們看到的一切。

本文作者:陳夢迪

繼續閱讀