天天看點

不是大資料的大資料與不是人工智能的人工智能 | 2016 TGPC

最近幾年,大資料這個詞出現的次數多到許多讀者和投資人都已經對它厭煩了。而且把它的原理詳細一解釋,大家又會有點不屑:不就是資料分析嗎,說得那麼玄乎幹啥?

但這正是大資料的屬性,在23日上午的騰訊全球合作夥伴大會金融分論壇上,騰訊雲副總裁,支付基礎平台與金融應用線金融資料應用負責人蔣傑在演講中提到,當任何東西用大資料實作之後,大家就不再叫它大資料了。不過這并不意味着它不再重要,事實上,大資料已經融入到了我們生活的方方面面,而蔣傑講的,就是大資料在金融領域的應用的一些執行個體,我們可以發現,大資料和雲早已全方位的覆寫了我們的金融生活。

不過我們意識到,其實在蔣傑的演講中還包含了一項與大資料有着千絲萬縷聯系的技術:人工智能。大資料是人工智能賴以實作的基礎,而人工智能的境遇也同大資料太像了:一旦某項技術用人工智能實作了,人們就不再叫它人工智能了,以至于我們老是在抱怨為什麼都看不到人工智能的成熟應用。蔣傑的演講中多次提到深度學習、lstm等屬于人工智能的專有名詞,卻從不刻意強調它是人工智能的現象也恰好從側面印證了這一點。不過雖然大資料和人工智能在不斷的走下神壇,卻并不意味着它們的作用就會變得不重要了,從蔣傑的演講中我們也可以看到,人工智能在金融領域已經發揮了相當巨大的作用。或許我們也可以參考這種思路,将人工智能應用到别的它尚未發揮這麼大作用的領域中去。

下面是蔣傑的演講全文:

大家好,我今天給大家分享的題目叫《你的一天,金融大資料》。

很多人覺得大資料這個詞看起來很神奇,但是資料真正可以給你帶來的價值是什麼?我是說,直接跟錢相關的那種價值,很多人其實弄不太清楚。資料是企業的資産,但是這背後可以有更深的奧秘,因為孤立的資料是沒有意義的,而且這些大資料的擷取和分析都需要很多成本,是以當大資料真正跟商業結合,能夠創造價值的時候,它本身才有自己的生命力和價值。

今天,我主要跟大家分享的是在你實際的一天生活當中,關于你的金融大資料,整個的展現是怎樣的。

我先給大家舉個例子。在130年前,世界上第一輛汽車誕生的時候,很多人會圍觀它,覺得很神奇。但是今天在大街上看到一輛汽車的時候還會很驚訝嗎?大資料其實也一樣,當一樣東西被大資料用十分成熟的方式實作了,人們就不再叫它大資料了。是以我覺得這句話可以這麼說:我認為未來沒有大資料,因為那時候的大資料就在生活的一點一滴當中,我們根本不用關心它的存在,也不用去談論它的概念、或者它可以給我們帶來什麼價值,因為它就在我們身邊。

不是大資料的大資料與不是人工智能的人工智能 | 2016 TGPC

從清晨到日落,大資料在你身邊其實無處不在,當你早上起床,購買早餐、看新聞資訊、買保險、做一些貸款這些動作的時候,都會出現大資料的身影,我可以給大家解釋一下,雖然這些功能大家可能每天都在使用,但是很多人沒有發現這背後是一場資料的盛宴。

支付

我們假設現在是早上,你打算出門買一份早餐,現在流行微信支付、qq支付,大家發現有了這種支付方法,不用帶錢包也可以買到東西,不過大家可能不知道其實在這件事情背後有很多的資料在産生和分析,當你支付的時候我們的背景會識别你是不是壞人,比如你的ip是不是在我們可信範圍之内,你的支付環境是不是異地支付、或者是不是在常用的裝置上進行支付,你支付的動機是不是用來詐騙或者做什麼壞事的,通過背景強大的風控系統和資料來實時進行這些操作。

不是大資料的大資料與不是人工智能的人工智能 | 2016 TGPC

其實就像上面舉的這個例子一樣,很多大家操作起來非常簡易的動作,我們在背景都有非常複雜的資料,來讓我們前端的體驗變得簡單、完美,這是顯而易見的。未來這種支付會越來越簡單、越來越貼近我們的生活。

資訊

當我們在上班途中,在地鐵、在公交上,你可能會打開手機看一些資訊,你可能會看很多很多的資訊,騰訊原來是怎麼做資訊的呢?最早是以雅虎、新浪的模式,編輯先編輯好然後放在網站上,你被動的去看。

但是現在我們實作了精準推薦,騰訊新聞會基于你曾經浏覽時表現出來的一些行為和興趣,做個性化精準推送,這是一個改進。但是現在處于資訊泛濫、資訊過多的時代,如何能在海量資訊中選出最适合你的呢?是以我們更進了一步,(雷鋒網注:騰訊開發了财經寫作ai dreamwriter,曾轟動一時)讓每個人所看到的資訊都是不一樣的,都是量身訂做的。我們通過你過往的一些行為,或者根據你的朋友在看的内容等資料為依據,可以用機器人在你每一次重新整理的時候用幾十毫秒寫出你們想要的資訊,在這種情況下你每刷一次資訊都是不一樣的,也是真正為你量身定制的一種資訊體制,可以給你更精準的資訊服務,這是我們現在在持續優化的一種财經資訊的報道模式。

《紐約時報》也有很多這樣的财經新聞政策,這是一個基于深度學習、增強學習的疊代過程,利用騰訊豐富的使用者資料和使用者興趣勾畫出使用者的畫像,通過精準投放、精準推薦的系統,把原來推薦廣告的技術和模式運用到這裡來,形成一個新的結合體。

股票

我們來看第三個例子,現在時間到了九點半。在這個時間點,很多人都會打開手機去看看他們的炒股軟體,像自選股。在這個過程當中其實我們會利用騰訊理财通的資料去預測,在上千萬的使用者當中找到幾萬使用者,我們稱他們為“智能使用者”,這些智能使用者有一定專業知識,我們可以從他們的行動中提煉出他們的行為規則,整理出來更好的投入我們服務普通使用者的政策體系。

不是大資料的大資料與不是人工智能的人工智能 | 2016 TGPC

其實我們在這裡面用到了通過海量的資料的分析和騰訊已有的一些自身的資料去做一個現代最流行的、內建深度學習的政策,能夠讓整個對股票走勢的預測更加精準,這樣一種精準的體系能夠讓我們更好的控制我們客戶的風險,能夠幫助客戶更好的選擇指數基金或者股票基金,各種這樣的資訊,這是一種新型的、可以說是“懶人”的模式,把你原來每天需要去機械性關注的資訊自動化處理,人工智能的特性能夠用資料進行完美的展現,這是我們在股票、炒股方面的一個研究和探索。

保險

到了九點半以後我們會看什麼?也許你今年的車險已經到期了,騰訊提供了一個服務能夠讓我們的車險買的更便宜,我們的目标是希望它是目前全網最便宜的車險,這是怎麼做到的呢?為什麼我們能給出比傳統的保險公司更低的保費呢?比如說你買了一輛奧迪a4,但是你開一年這輛車,跟其他同品牌、購買時間相同的人最終買到保險可能是不一樣的,有的人是每天兩點一線,有的人天天跑長途,他們的出事機率是一樣的嗎?當然不一樣。

可以跟大家分享一個有意思的數字,我們發現,如果一個人關注探險、徒步這樣的冒險,或者追求刺激和暴力遊戲等娛樂,他們開車的習慣會非常猛,是以這些資訊可以幫助我們預測未來保費的政策,這是我們找到的跟車主最合适的一個應用:在保險裡的深度應用,我們希望可以給大家提供最優的保費,在這裡也希望給大家提供這樣一種政策。

理财

當時間來到中午的時候,你一定會在寫字樓裡面打開手機,可能你會想為自己理一下财,增加一下自己的财富,這時你就會打開“理财通”這樣的應用,當你打開“理财通”的時候,如果我們不知道你是一個什麼使用者,其實我們給你們提供的服務是不精準的,你會把它當成是廣告,而廣告是你比較讨厭的。但是如果這個服務是為你量身訂做的話,你一定會詳細看,是以我們在這樣的過程中,首先我們會對每個使用者進行深入的了解,這就是我們前面提到的财富值。

很多人會想問,我們财富值是不是跟傳統銀行的模式一樣,是不是跟我們信用的體系是一樣的?其實它們有本質差別,信用體系是一種判斷使用者償還能力的過程,資料可能半年更新一次就可以滿足要求,但如果是理财平台,在你剛發工資,或者剛領薪水的時候,你的理财需求跟平時是完全不一樣的。我們要解決的是什麼問題呢?其實就是一個資産能力和風險控制能力的問題,首先必須要有錢才會理财,你有多少能力來理有多少風險的理财産品,這是互相對比的過程,是一個二維的過程,而不是單維的過程。

有些年輕人作為網際網路的潮流新貴,追求高收益、高風險,他們可能能夠接受虧損率達到20%,但是他們也可能追求30%到40%的回報率,但是可能對老年人來說,他們的退休工資普遍不多,冒險意識也一般不強,是以老人可能比較不想讓錢有所損失,可能他需要的隻是一種類似貨币基金的理财,可能比銀行的活期利率高個幾倍就可以滿足他的需求,是以每個人的需求都是完全不一樣的。

我們現在把使用者分為八類,從低風險低收益,到高風險高收益,我們現在已經把這個象限拆開了,有一個資料學家說,如果可以把企業可以把它的使用者分類成兩千個群體的話,那麼它在做任何的營銷和任何活動的時候,都會對活動所面對的對象了解的非常深刻,但是随着技術的發展和網際網路體系的發展,人們對整個金融需求越來越旺盛的時候,我們已經把可以這個種類擴充到兩萬,未來甚至會更多,我們會有更精準的營銷手段。

開戶

到了下午五點鐘,下班了,你可能想去銀行開個戶,但是大部分銀行四點鐘已經關門了,怎麼辦呢?你可以在騰訊投資的銀行裡面進行開戶的操作,開戶的時候,身份證的識别靠的就是背景人工智能的挖掘,當我們開戶的時候,大部分都會做一個人臉識别,這個人臉識别其實就是圖象識别的應用,深度學習技術的應用能夠讓人臉識别的準确率達到90%以上。

現在在網際網路金融領域,大部分都在使用活體檢測技術,讓你左右搖擺一下,這讓我們整個的準确性變的更高,(雷鋒網(公衆号:雷鋒網)注:防止使用照片造假)通過活體檢測的過程跟公安部的資料進行實時比對,馬上就可以完成開戶的過程,在任何時候、任何地方都可以做這件事,哪怕是在銀行的工作時間以外,這可以給你的生活帶來很大的變化和便利,目前這項技術已經在大量運用了。

彩票

世界杯、歐洲杯剛剛過去,可能你看球的同時也會想買一些彩票,我們在騰訊裡面也可以買一些足彩,其實我們前段時間做了一個大資料的勝負預測,我們會去預測這麼多隊,每個隊在比賽的時候會踢進多少球,最終各隊的勝率會是多少。如果要用矩陣來進行運算的話,這會是一個超高維的矩陣,在這個裡面可以看到很多大資料的影子和技術,任何一個預測其實都是基于大資料來進行的。

不是大資料的大資料與不是人工智能的人工智能 | 2016 TGPC

這裡面用的是最早用于飛彈彈道計算的一種算法,我們把它運用到足球上面來。原來在金融領域不可能去用的一種圖象學的政策我們現在把它應用到了金融的領域,而我們現在用的這種分類體系在整個預測裡面得到了集合和應用,是一個結合體,單獨一種算法無法滿足我們預測的精準性的要求,這是我們現在逐漸摸索的。五年前我們預測使用者的流失、使用者的挽留,用的都是很簡單的預測模式,但是現在我們已經改進了很多。

貸款

當你晚上八點鐘在家裡的時候,如果要買一個什麼東西,你可能會希望通過貸款的方式來進行,但是就我們來說,不可能每個人他想貸多少我們就讓他貸多少。我們如何判斷一個人能貸多少錢,這個人是不是有風險,這是不是一筆真實的交易?這時候就要對你的信用進行評估,現在信用評估的背後大量的在使用lstm這種深度學習的算法,這比原來算法的準确率至少要高出20%。

有一家美國公司,創業者是從谷歌出來的,他們通過fackbook上的資訊和利用lstm的算法,得到的結果準确率已經可以完全超越美國其他的信用公司,這種全方位的資料進行深度學習以後,能力已經可以超過傳統的交易資料,這個事情已經被證明了,并且已經得到了很多企業的應用,是非常值得大家去關注的事情。

服務

到晚上,如果你想買一個理财産品,想要了解關于它的資訊的時候,原來是需要打電話的,但這時可能客戶經理已經下班了,客服熱線可能出現故障了,如果你現在打開我們fit的公衆号,輸入“我要理财”這幾個字,它就會幫你推薦你感興趣的理财産品,這是一個智能機器人。我們以前的服務産品叫智能客服,不過智能客服是一個單向的東西,是你有需求它才會回應你的,現在我們把這種被動需求變成了主動和被動相結合的體系。

我們根據你以前消費和支付的習慣,已有的資産能力,我們能為你推薦出來最适合你的方案。當然我們也會關注你的朋友、你朋友的朋友在幹什麼,你朋友的朋友喜歡什麼,他們的收益是怎樣的,通過這些政策的結合,為你推薦最合适的理财需求和智能方案。

當然,很多家庭主婦,包括一些理财的人會做一些記帳的過程,現在很多記帳軟體都是手動輸入,如果你在手機上關注了騰訊“多多記帳”這個公衆号就會知道,通過語音的手段就可以把你整天的過程全部記錄下來,非常簡單,其實它背後的語音識别技術也有大資料的應用在裡面,今天你在超市消費的帳單可以輸入到裡面,這種簡單的模式其實也得到了非常強大的運用。

健康

到晚上十一點睡覺的時候,你可以記錄自己的體重,我們可以根據你的健康資料建立未來壓力的關系預測和運動計劃的提醒,這些在大資料裡面都可以得到非常好展現,當有一天你買壽險的時候,這些資料可以為你帶來很大的友善。

我們通過你的一天,看到了大資料應用的整個過程,生活當中每時每刻都有資料的出現,不過這些資料都是離不開你的,大家應該好好對待大資料中屬于你們的這一部分,這樣你會創造很多很多的價值,因為資料無處不存在,因為資料,你能夠在你堅持的領域裡面找到屬于自己的路。我的分享完了,謝謝大家。

本文作者:黃鑫

繼續閱讀