天天看點

《大規模元搜尋引擎技(1)》一第2章 元搜尋引擎體系結構

本節書摘來自華章出版社《大規模元搜尋引擎技(1)》一書中的第2章,作者[美]孟衛一(weiyi meng)紐約州立大學賓漢姆頓分校於德(clement t.yu)伊利諾伊大學芝加哥分校,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

元搜尋引擎是一個提供統一方式通路多個現有搜尋引擎的搜尋系統。該系統基于元搜尋(metasearch)概念,元搜尋是實時線上搜尋多資料源的模式。元搜尋與聯合搜尋(federated search)的含義非常相似,這兩個術語有時可以互換。元搜尋引擎有時也稱為搜尋代理(search broker),因為它在搜尋資訊的使用者和一組搜尋引擎之間充當“中間人”的角色[craswell,n.,2000]。元搜尋引擎與分布式資訊檢索(distributed information retrieval)[craswell,n.,2000]和聯合搜尋系統(federated search system)[shokouhi and si,2011]密切相關,盡管它們之間存在一些差異,這些将在2.1節中讨論。

web元搜尋概念從20世紀90年代初就出現了。最早的元搜尋引擎之一(如果不是最早的話)metacrawler(http://www.metacrawler.com/)首次開發于1994年。此後,大量的元搜尋引擎被開發出來并用于web。本章及随後的章節将提到其中一些元搜尋引擎。

本章對元搜尋引擎技術進行一般性讨論。2.1節介紹可供參考的元搜尋引擎體系結構。該結構包含所有主要的系統部件,并且描述每個部件的功能。2.2節比較元搜尋引擎技術與搜尋引擎技術,并深入分析其優缺點。其目的是提供一個令人信服的論點,即元搜尋引擎技術,特别是大規模元搜尋引擎技術,具有搜尋引擎不具備的優越和獨特的功能,使其能夠在越來越重要的web搜尋領域扮演重要的角色。2.3節對元搜尋引擎建構和操作的web環境進行仔細分析,目的是弄清楚建構元搜尋引擎特别是大規模元搜尋引擎将會遇到的困難和挑戰。

繼續閱讀