天天看點

Bingo大戰:決勝大資料時代

必應(Bing)又一次成為了IT行業的新聞焦點。這次,它以強大的自信發起了一場名為“必應搜尋,全球PK賽”的活動,主要針對谷歌PK搜尋結果的品質。

據媒體報道,“第三方獨立調研機構統計結果顯示,中國有75%的參與者首選微軟必應提供的結果”。我抱着對這個結果将信将疑的态度參與了這項測試,也許因為之前有多年使用Google的緣故。反複幾次之後,有了比較深入的切身體會。剛開始的時候,我輸入一些普普通通的詞彙,兩者搜尋結果的差別不大,勝負難分,僅僅在結果排序上表現出其背後的算法差異。随着我對一些敏感詞彙和熱點關注的時事話題進行搜尋PK的時候,高下可以說立現了。諸多事件,諸多主角,搜尋結果都是驚人的一緻:必應能夠立即在不引起争議的前提下,有選擇性地給出有價值的答案,幫助搜尋者達到了解事件和人物資訊的最終目的,而谷歌則一律拒絕顯示搜尋結果(經直接進入谷歌嘗試,結論一緻)。無論某×××事件的主角,還是更具時代争議的重慶人物,等等等等,都是如此。

從這裡我得出結論,無論從算法上,還是對中國市場的了解上,必應都勝出一籌。那麼,應該是時候從谷歌移民必應了。讨巧的是,把這場活動雙方的首幾位字母連成一個單詞,居然是Bingo!

整個IT行業都在高談闊論大資料,探讨大資料帶來的營銷變革,憧憬大資料将要滋生的機器智能,幾乎沒有人回過頭去關注大資料産生的麻煩。如何從浩如煙海的資料海洋中篩掉資料垃圾,尋求自己真正想要的答案,這個問題重新回到搜尋引擎這個生活學習工作都無法離身的“傳統”工具上來。微軟資深副總裁張亞勤這樣指出:“大資料要求人們改變對精準性的苛求,轉而追求混雜性;要求人們改變對因果關系的追問,轉而追求相關關系;這種思維的轉變将是革命性的”。

查全率是第一代搜尋引擎的競争關鍵,是以Yahoo和AltaVista成為了90年代的佼佼者;查準率是第二代搜尋引擎的核心任務,是以Google和百度脫穎而出。而在大資料時代,全和準都不是問題了,“價值”這個更加模糊更加人性化的東西成為了搜尋引擎的核心競争尺度。在大資料的背景下,抛棄直接因果和純粹邏輯,擁抱魚龍混雜的資料結構和縱橫交錯的關系脈絡,是下一代搜尋引擎所不得不具備的典型特征。而這一點,必應讓我們感受到了。還記得微軟幾年前的那個“人立方”嗎?雖說隻是一個好玩的東西,但其實背後我看到的恰恰是微軟對大資料的尊重和人類思維模型的不懈探索。

英國經濟學家霍奇遜曾在《現代制度主義經濟學》一書中表達了這樣的觀點,“最大化的進化論,或者說最優行為的達爾文機制是以理性主義行為觀為基礎的”;但“無論從方法論、心理學、社會學和政治學哪個方面來看”,理性主義都陷入了“自相沖突”,因為“認知和思維過程的複雜性以及需處理的資訊數量,對理性思維來說,都面臨着資訊太少和資料太多的沖突”。需要解釋的是,霍奇遜這裡所講的“資料太多”就是我們今天的大資料,而“資訊太少”的“資訊”則是指經過有效處理之後的資訊,類似于搜尋結果。

繼續閱讀