天天看點

百度股市通如何實作智能選股?

大資料應用在金融行業是老生常談,最被人們津津樂道的是“海量Twitter資訊中的情緒狀态名額與道瓊斯工業标準指數之間存在關聯關系”,這來自于印第安納大學計算機科學家Johan Bollen的一個報告,尚在學術研究層面。這方面一直缺乏商業化應用,而百度自去年開放大資料引擎,已經在多個領域進行了大資料的應用和嘗試,尤其是去年世界杯期間,百度大資料對淘汰賽的比賽結果預測正确率達到94%,領先微軟、谷歌和高盛。目前,百度基于大資料應用又釋出了一款最新的手機股票軟體“百度股市通”,通過其獨創的股市知識圖譜,可以為股民提供最新股票熱點資訊幫助使用者發現這些資訊與股票的關系。

當股市遭遇網際網路大資料

百度股市通定位為股民選股的輔助工具,尤其是彌補了市面上股票軟體在消息實時性、全面性、關聯性和智能性上的不足。它的核心思路是利用大資料,聚合有價值的新聞資訊和使用者資料、尋找股票與消息、股票與股票之間的關聯,并且整合第三方的專業金融資料,給股民最有價值的資訊。

百度搜尋每天會接到數億條政經相關的搜尋請求,以及百度新聞每天收錄的數百萬條資訊,這都是百度天然的大資料優勢。還有全球股市的交易行情,這部分各家都有,隻要做到及時準确就可以了。從産品試用來看,百度應該有從證券機構擷取專業的研報、公告等,比如在某個個股資訊裡,“百度股市通”有專門的“研報”類别,會顯示所有機構對該股票的評級。百度股市通把這些資料挖掘後再聚合的方式進行呈現。

當然,百度的大資料顯然不止這點作用,百度股市通還将海量資料與2000多隻A股股票關聯起來,同時将不同股票關聯起來,發掘熱點資訊與個股的關系,某個熱點事件可能會影響哪些股票,這就是其産品的核心功能“智能選股”。

距離預測股價還很遙遠,做選股助手同樣實用

成功預測股價有着巨大的商業價值,但世界上還沒有任何個人、機構、技術或者産品可以百分之百地準确預測股價。股票價格受到諸多因素影響,短期主要是消息,消息引發股民決策進而形成一輪博弈,博弈結果是股價;長期則是企業本身價值與投資者期望值之間的契合度。

而股價是“人為因素決定”,傳統的金融學是建立在随機行走和有效市場假說的基礎之上,在有效市場假說理論中股價的變動很大程度取決于消息(新聞),市場上新資訊的出現不可預測。這與天氣這類有規律可循的自然現象不同,但在分析原理上也有類似可參考的部分。早期的天氣預測主要依靠經驗來判斷,準确率很低,随着科技發展,人們發明了越來越多的氣象儀器,現在的天氣預測會根據氣象衛星發回的雲圖和氣象站測得溫度、氣壓、風向、風速等資料來列出相應的方程組進行分析判斷,這裡同樣也是大資料的應用,而由于方程組是非線性的,一點點的誤差就有可能造成結果的巨大差別。是以理論上來說,任何預測都不可能是100%準确的。百度股市通聰明的地方就是并不預測股票的漲跌(這也是證監會禁止的),隻是預測熱點事件的發展走勢,并将熱點事件相關聯的股票提供給使用者,至于最終的投資決策還是由使用者自己決定。

市面上已有大智慧等炒股工具,但它主要是交易和資料系統,順帶提供了少許資訊,沒有大資料應用,在實時性、關聯性上存在短闆。另外雪球财經這類App在個股資訊和讨論上做得很好,在熱點事件、股票關聯上也沒有對應的大資料産品。百度股市通是市面上唯一基于大資料提供智能選股服務的股票軟體。

股市知識圖譜是百度股市通基礎,進入門檻高

在百度股市通之前,已經有基于大資料的選股協助工具,不過隻停留在“指數”層面,騰訊曾在2013年聯合專業金融機構推出“騰安價值100指數”,去年百度也聯合中證指數公司和廣發基金釋出“百發100”網際網路金融指數。全球知名指數都是媒體釋出的,随着網際網路金融發展,網際網路媒體在資訊聚合能力和資訊釋出管道上的優勢都在得到展現。百度是“媒體之上的媒體”,做指數也不足為奇。

但是百度股市通與指數有非常大的不同。指數隻是把股票市場整體趨勢量化,百度股市通更多展現在“個性化”上,比如根據熱點事件命中“事件影響股”,再根據使用者訂閱推送關聯消息。另外百度股市通可以直接呈現熱點消息和第三方專業資料,幫助使用者在縱橫交錯的海量資訊中找到與股票相關的最新資訊。

指數和百度股市通都是基于大資料,但百度股市通還多了一層,即知識圖譜。知識圖譜的要義就是找到不同資訊的關聯性,形成一個網狀的知識結構,所謂圖譜。而股市知識圖譜就是建立起各類資料、資訊與股票的關系,以及股票與股票之間的關系,是以可以第一時間通過各種資訊的熱度變化來分析股票未來可能的走勢。百度的股市知識圖譜在資料上有優勢,在技術上也有特長,百度在搜尋結果頁中早已整合了知識圖譜便于使用者進行二次搜尋。知識圖譜技術核心是自然語言處理和深度學習技術的資料挖掘,這是百度擅長的。海量資訊關聯性靠人工來梳理不現實,耗時耗力無法滿足實時性需求,基于深度學習技術,百度股市知識圖譜本身可以實時疊代,模型本身也在不斷更新。是以,指數産品CCTV、騰訊等媒體都可以做,但股市知識圖譜隻有搜尋引擎公司才可以做,這也是百度股市通實作“智能選股”的關鍵所在。

百度股市通對于百度的價值在哪裡?大資料商業化和網際網路金融

百度股市通隻是百度衆多大資料産品中的一個。2014年開始百度已陸續推出流感預測、景點預測、商圈熱力圖、世界杯預測等基于大資料的産品。股市通是百度在大資料商業化上的又一個新産品,并且首次涉足證券領域,證券與大資料有天然關聯性,結合點正在越來越多。

另外值得注意的是網際網路金融已是百度非常重要的新業務方向。百度要做O2O就必須大力發展百度錢包這一網際網路金融工具,二是百度本身是一個流量和營銷入口,是以與基金合作推出百發、百賺、沃百富以及面向企業的小貸産品,是其這兩年重點做的事情。做“百度股市通”在資訊資料層面進一步完善了百度網際網路金融的版圖,這是其所擅長,也有商業價值,比如未來做個性化收費版本、可以成為百度網際網路金融産品的銷售管道、甚至百度也有可能自己做一家證券機構,直接為股民提供全方位的服務。

可以看到百度股市通整合了不少傳統金融機構的資料和服務,比如合作券商核心操盤内參等等,未來不排除會引入專業的操盤手或者分析師進入給股民做咨詢服務。這也迎合了百度要“連接配接人與服務”的趨勢。

小結一下:百度股市通是百度大資料業務進入金融領域的開始,它為百度在網際網路金融上補齊了“資訊”這一環,百度在自然語言處理、深度學習上的基礎技術是這款選股助手的基礎。

微網誌@網際網路阿超 微信 羅超(luochaotmt)