天天看点

Bingo大战:决胜大数据时代

必应(Bing)又一次成为了IT行业的新闻焦点。这次,它以强大的自信发起了一场名为“必应搜索,全球PK赛”的活动,主要针对谷歌PK搜索结果的质量。

据媒体报道,“第三方独立调研机构统计结果显示,中国有75%的参与者首选微软必应提供的结果”。我抱着对这个结果将信将疑的态度参与了这项测试,也许因为之前有多年使用Google的缘故。反复几次之后,有了比较深入的切身体会。刚开始的时候,我输入一些普普通通的词汇,两者搜索结果的区别不大,胜负难分,仅仅在结果排序上表现出其背后的算法差异。随着我对一些敏感词汇和热点关注的时事话题进行搜索PK的时候,高下可以说立现了。诸多事件,诸多主角,搜索结果都是惊人的一致:必应能够立即在不引起争议的前提下,有选择性地给出有价值的答案,帮助搜索者达到了解事件和人物信息的最终目的,而谷歌则一律拒绝显示搜索结果(经直接进入谷歌尝试,结论一致)。无论某×××事件的主角,还是更具时代争议的重庆人物,等等等等,都是如此。

从这里我得出结论,无论从算法上,还是对中国市场的了解上,必应都胜出一筹。那么,应该是时候从谷歌移民必应了。讨巧的是,把这场活动双方的首几位字母连成一个单词,居然是Bingo!

整个IT行业都在高谈阔论大数据,探讨大数据带来的营销变革,憧憬大数据将要滋生的机器智能,几乎没有人回过头去关注大数据产生的麻烦。如何从浩如烟海的数据海洋中筛掉数据垃圾,寻求自己真正想要的答案,这个问题重新回到搜索引擎这个生活学习工作都无法离身的“传统”工具上来。微软资深副总裁张亚勤这样指出:“大数据要求人们改变对精准性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系;这种思维的转变将是革命性的”。

查全率是第一代搜索引擎的竞争关键,所以Yahoo和AltaVista成为了90年代的佼佼者;查准率是第二代搜索引擎的核心任务,所以Google和百度脱颖而出。而在大数据时代,全和准都不是问题了,“价值”这个更加模糊更加人性化的东西成为了搜索引擎的核心竞争尺度。在大数据的背景下,抛弃直接因果和纯粹逻辑,拥抱鱼龙混杂的数据结构和纵横交错的关系脉络,是下一代搜索引擎所不得不具备的典型特征。而这一点,必应让我们感受到了。还记得微软几年前的那个“人立方”吗?虽说只是一个好玩的东西,但其实背后我看到的恰恰是微软对大数据的尊重和人类思维模型的不懈探索。

英国经济学家霍奇逊曾在《现代制度主义经济学》一书中表达了这样的观点,“最大化的进化论,或者说最优行为的达尔文机制是以理性主义行为观为基础的”;但“无论从方法论、心理学、社会学和政治学哪个方面来看”,理性主义都陷入了“自相矛盾”,因为“认知和思维过程的复杂性以及需处理的信息数量,对理性思维来说,都面临着信息太少和资料太多的矛盾”。需要解释的是,霍奇逊这里所讲的“资料太多”就是我们今天的大数据,而“信息太少”的“信息”则是指经过有效处理之后的信息,类似于搜索结果。

继续阅读