天天看點

騰訊搜搜孫良:“情境搜尋”更懂你

騰訊soso

【TechWeb】2010年12月9日,谷歌地理位置和本地服務副總裁瑪麗莎·梅耶爾透露,谷歌有望明年正式推出“情境發現”服務。而這恰恰與2009年騰訊搜搜提出的“情境搜尋”如出一轍。近日,筆者就“情境搜尋”的相關問題采訪了騰訊搜尋技術研發中心總經理孫良。

TechWeb:“情境搜尋“是何時提出的?

孫良:大概09年初,搜搜開始對情境搜尋概念進行内部讨論。其實更早的時候,我們就在考慮搜搜如何去做搜尋。09年9月份,在CSDN的SD2.0大會上,“騰訊搜搜情境搜尋“概念首次對外提出。

TechWeb: 搜搜的“情境搜尋”與谷歌的“情境發現”有何不同?

孫良: 兩者差別不大,都為實作不需搜尋的搜尋。騰訊搜搜的情境搜尋主要由兩方面組成,一方面是PC側、結合騰訊各個産品的搜尋,其中有很多種形式,比如“邊聊邊 搜”。實際上“邊聊邊搜”也有多種形式,目前已經實作的是在QQ聊天面闆中點選搜尋按紐,就能呼出搜尋框并在裡面進行搜尋。同時,我們也可以在聊天的内容 中highlight(高亮)一些熱點關健詞,這些關健詞下面都會标注下滑線,滑鼠點上去就會在右側彈出搜尋結果。這種體驗将來也可以延伸到QQ.COM 的新聞頁上——我們highlight新聞中的關鍵詞,點選既能觸發搜尋氣泡(其實一種浮層視窗),搜尋氣泡是以關健詞為搜尋内容的結果,同時,上面還有 一個大搜尋框,幫助使用者在看新聞的時候,對人名、地名以及一些事件進行延伸閱讀,全面了解事件的背景資訊。

舉例來看,比如我們需要了解哪些華人獲得了諾貝爾獎,也許我們對新聞頁中看到的華人諾貝爾獎得主并不熟悉,那麼我們可以對新聞頁裡華人的名字進行 highlight,滑鼠移動到highlight文字上面去(Mouseover the highlight),即可呼出搜尋氣泡,裡面的搜尋結果包含跟這個華人相關的一些搜尋内容,包括他的演講視訊、百科結果以及他的一些相關背景、事迹的介 紹。這樣會幫助閱讀新聞的使用者很快了解到該諾貝爾獎得主的一些背景資訊,我們也稱之為一種情境搜尋,它是主動以關健詞作為一種動态搜尋訂閱結果來為閱讀新 聞的人提供更多的背景資訊,這些資訊不需要直接搜尋,而是推送給使用者的。

另一種方式是手機側的産品,與LBS相類似,主要是結合我們的手機地圖,目前搜搜正在開發這種産品。利用基站(CELL ID資訊)與GPS(全球衛星定位系統擷取的精确經緯度資訊)定位我們可獲知使用者手機所在的區域中商鋪、店面、飯店、酒店等跟使用者衣食住行有關的資訊。這 使得我們能夠了解使用者在哪裡,以及以使用者為坐标中心點的周圍有哪些吃喝玩樂的地方,這樣就可以直接把相關内容提供給使用者,而不再需要有搜尋框。

TechWeb: 這是不是我們說的生活地圖搜尋?

孫良: 是個性化的生活地圖搜尋。我們現在生活地圖搜尋的第一階段目标就是無搜尋框,直接告訴使用者你在哪裡,你能夠做什麼,而不需要親自進入搜尋框搜尋。目前美國 的Foursquare公司已推出類似功能,但是仍然需要使用者主動登入,登入的過程就是告訴背景系統這個使用者現在在哪裡。而搜搜未來要做的是無需使用者登 錄,而是直接利用手機定位使用者,然後把所在地周邊的資訊都推送給使用者。手機側的應用中“境”就變成了位置(Location)。“情”展現的是使用者之前在 手機搜搜中發生了哪些使用者痕迹,比如會關注哪些飯店、娛樂場所、音樂等資訊。

TechWeb: 會不會有更多搜尋廠商加入“情境”的發展中來?

孫良: 很有可能。“情境搜尋”肯定是未來的一個趨勢,而之前基于PC側門戶型的個性化搜尋比較簡單,隻是根據使用者在PC下留下的一些痕迹來考慮使用者的興趣愛好, 比如使用者經常搜尋的内容、搜尋曆史、浏覽過的網頁等。現在的“情境搜尋”更加延伸,并能更好的解決使用者的長期興趣與短期興趣的平衡問題。長期興趣是指使用者 所有的搜尋過程中産生的一些痕迹,短期興趣是指使用者短期内會關注什麼東西。比如說,使用者長期關注股票證券類的投資資訊,但是短期内,可能對世界杯比較感興 趣。但是如果這兩個方面的平衡沒有把握好,搜尋引擎還是以長期興趣為主,協同過濾給出結果,這對使用者來說就不是最優結果。情境搜尋恰好能夠解決這一問題, 不但考慮使用者長期的興趣愛好,還考慮短期所處的“境”,比如使用者當時正好在看世界杯,或者說在看一些世界杯相關的資訊,搜尋引擎便會提供世界杯資訊,而不 會還是提供證券類資訊來幹擾排序。這就是“情境搜尋”與普通個性化搜尋最大的差別。其他廠商後續也許會引入一些類似的技術,雖然未必會提出“情境”相關的 概念,但應該會越來越重視對使用者本身的挖掘,因為搜尋引擎本身就需要關注兩方面資料:一是網際網路上已有的資料,包含一些暗網資料;另外就是為了了解使用者真 正想要的東西,所需要掌握的“情”和“境”。

TechWeb:“情境搜尋“的行業意義是?

孫良:情境搜尋指明了未來搜尋發展的方向。這是因為搜尋發展至今,一直沒有解決好對人的了解,小小的搜尋框是沒有辦法确切表達使用者的資訊需求的,所 以在這種模式下無論對資料側如何進行加工,包括爬更多的資料量或補充更多的暗網資料,解決的都是資料的保有問題,而沒有解決對使用者的了解問題。也就是說, 在傳統搜尋框模式下,資訊含量較小,資訊密度不高,不足以表達使用者的真正需求。而情境搜尋則更多的考慮對使用者本身的了解,它将提供符合使用者應用場景、更貼 近使用者的智能化搜尋,這符合搜搜更懂你的發展戰略,同時也代表着未來搜尋的研究方向和目标。

TechWeb:“情境搜尋“領域是否有1.0或2.0的發展版本之說?或者說有哪些發展階段?

孫良:這樣劃分不科學,因為它不是一個産品的版本,它是一種技術趨勢,是新一代搜尋引擎技術,沒有必要做出一二代的劃分,如果按照幾代劃分,那也屬 于技術層面的革新。搜尋是一種基礎服務,是以情境搜尋應該是一種滲透實施過程,滲透到各個應用場景的無處不在的搜尋。比如在玩遊戲的時候,要搜一些遊戲道 具或者攻略,可能需要用到搜尋。在這個過程中,”情境搜尋“還會提供一些相關攻略資訊,這是結合使用者,了解他的興趣愛好到底在哪裡。是以第一階段,是将搜 索無處不在地融入到各個應用場景中去。同時,第一階段我們也要關注手機側。應該說,未來搜尋的決戰在手機側(更确切說是移動終端側),因為手機側具有天然 的優勢,比如可以利用使用者的碎片時間,也可以非常友善地接入一些産品體驗,這些産品體驗會降低使用者通路搜尋引擎的門檻,例如通過拍照就可以完成搜尋字元串 的錄入等。是以,”情境搜尋“未來的實施可能是分領域、分方向去完成的,而不是以“代”劃分。真的要從“代”這個角度來講,那可能要讓搜尋的互動方式有革 命性的變化。比如未來的搜尋會像《終結者》這個科幻片電影一樣,使用者配備一些裝置,比如一個高清攝象頭作為“眼睛”,通過“眼睛”記錄一切可觀察的東西, 然後進行數字化模式識别技術,最終一些特殊的QUERY送出給“雲端”的智能搜尋系統,最後“雲端”系統把對該事物非常完整的專題新回報給使用者,是以“情 境搜尋“其實自動提供使用者所需的更多延展資訊。

TechWeb:近日騰訊提出“開放”的發展戰略,對此搜搜将如何響應和支援?

孫良:在騰訊提出“開放”的發展戰略之前,搜搜已經提出了開放平台的理念。事實上在百度提出開放平台之前,搜搜已經開始建設“直達區”,“直達區”已經展現了開放平台的概念,因為直達區的資料是來源于第三方廠商的暗網資料,使其形成了開放平台的雛形。

TechWeb:搜搜的情境搜尋和開放平台是什麼樣的關系?

孫良:搜尋引擎本身并不解決資料産生問題,所有資料均來源于網際網路,但是網際網路中有一部分資料是不對搜尋引擎開放的,而情境搜尋是以使用者需求為中心 的搜尋技術,是以隻有搜尋實作“開放平台”,搜尋引擎才能擁有更多的高品質資料,才能更好地通過情境搜尋技術滿足使用者的需求。比如,搜搜能夠感覺到使用者是 醫學院的學生,需要關于心髒病方面的專業知識,如果搜尋引擎隻是在他檢索時給他傳回百科類的結果,對他的參考價值很小,但是如果能傳回比如一些醫學期刊中 需要付費的内容,那往往是他這類專業人士想要的東西,而這些高品質hidden web的資料内容必須通過開放平台才能接入,是以,開放平台跟情境搜尋是相輔相成的關系。

TechWeb:“情境搜尋”是否會以一種應用的形式向網絡平台開放?

孫良:“情境搜尋”可以通過插件形式嵌入騰訊網、搜狐網、新浪網等平台,隻要他們願意開放,這是一種方式。這與情境搜尋作為主體的情況下,資料層面是否需要通過開放平台來接入新的資料,或者接入一些暗網資料,是兩個概念。

TechWeb:相較于其他搜尋廠商,搜搜做“情境搜尋”的優勢有哪些?

孫良:從“境”的角度講,騰訊擁有很多産品且彼此間以QQ号作為聯系,能夠實作互動。産品越多,所在的境的資訊就越充分,是以搜搜可挖掘的“境”要 比谷歌多。“情”的方面同樣,比如騰訊有QQ群,有QQ号,以及QQ号的各種延伸産品和服務,是以我們可以看到使用者在各種騰訊的産品中的痕迹,側面了解用 戶的興趣愛好。

TechWeb:在微網誌和SNS方面,搜搜有什麼“情境搜尋“的規劃嗎?

孫良:微網誌與SNS其實沒有太大差别,一個是短部落格,一個是長部落格。SNS當然還有一些非部落格的其他應用。其中很多應用是偏文本型,使用者也是有搜尋 需求的。那麼我們可以通過放搜尋框、highlight關鍵詞這種方式來完成,從技術層面看已經沒有障礙,最關鍵的是讓相關業務部門接受我們這樣一個概 念,讓我們的“情境搜尋“插件作為一種觸角,能夠觸及到對方的資料。

繼續閱讀