
網際網路搜尋引擎為人們擷取資訊提供了極大幫助,目前仍是網民擷取資訊和知識的重要工具。通常使用搜尋引擎的典型過程包括三個步驟,首先使用者将自己的需求以自然語言查詢的方式表達,并送出給搜尋引擎;然後搜尋系統傳回與使用者查詢相關的若幹條網頁連結;最後使用者通過點選這些候選連結,浏覽對應網頁并從中尋找真正滿足自己需求的内容。不難看出,這種典型的擷取知識的過程是由機器和人工共同完成的,可以說是一種半自動的過程,尤其是點開連結從跳出的網頁中尋找資訊的過程,往往比較耗時。我們希望這個過程變得更加簡潔高效,讓上述過程的第二步和第三步由機器自動完成,減少人工參與成本,将使用者擷取資訊和知識的過程變成一問一答的方式。即使用者向系統送出自然語言查詢,系統直接傳回滿足使用者需求的答案。這個過程是搜尋向精準化演變的過程,包括搜狗搜尋在内的國内外主流搜尋引擎,正在朝着這個方向不斷前進。圖1示出了搜尋向精準化演變的過程。
作為一款具備智能問答能力的機器人,最近搜狗汪仔機器人(簡稱為“汪仔”)亮相江蘇衛視的《一站到底》節目,引發了不少關注。汪仔是搜狗公司研發的一款機器人,它能聽、會說、會看、善思考(問答和聊天),其背後內建了搜狗的語音識别、語音合成、圖像識别、深度問答和人機對話等多項AI技術。
本文将對汪仔的功能和背後相關技術作出較為詳細的描述,重點關注其智能回答的能力,并進一步介紹支撐汪仔智能回答能力的立知系統。這套具備回答開放領域各類問題的問答系統,已經成功應用到搜狗搜尋引擎提升搜尋效果。最後對搜尋引擎未來更加深入走向問答的方向和意義作簡要分析。