《大規模元搜尋引擎技(1)》一第2章元搜尋引擎體系結構

2021-11-08 13:35:02

本節書摘來自華章出版社《大規模元搜尋引擎技(1)》一書中的第2章，作者［美］孟衛一(weiyi meng)紐約州立大學賓漢姆頓分校於德（clement t.yu）伊利諾伊大學芝加哥分校，更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

元搜尋引擎是一個提供統一方式通路多個現有搜尋引擎的搜尋系統。該系統基于元搜尋（metasearch）概念，元搜尋是實時線上搜尋多資料源的模式。元搜尋與聯合搜尋（federated search）的含義非常相似，這兩個術語有時可以互換。元搜尋引擎有時也稱為搜尋代理（search broker），因為它在搜尋資訊的使用者和一組搜尋引擎之間充當“中間人”的角色［craswell，n.，2000］。元搜尋引擎與分布式資訊檢索（distributed information retrieval）［craswell，n.，2000］和聯合搜尋系統（federated search system）［shokouhi and si，2011］密切相關，盡管它們之間存在一些差異，這些将在2.1節中讨論。

web元搜尋概念從20世紀90年代初就出現了。最早的元搜尋引擎之一（如果不是最早的話）metacrawler（http：//www.metacrawler.com/）首次開發于1994年。此後，大量的元搜尋引擎被開發出來并用于web。本章及随後的章節将提到其中一些元搜尋引擎。

本章對元搜尋引擎技術進行一般性讨論。2.1節介紹可供參考的元搜尋引擎體系結構。該結構包含所有主要的系統部件，并且描述每個部件的功能。2.2節比較元搜尋引擎技術與搜尋引擎技術，并深入分析其優缺點。其目的是提供一個令人信服的論點，即元搜尋引擎技術，特别是大規模元搜尋引擎技術，具有搜尋引擎不具備的優越和獨特的功能，使其能夠在越來越重要的web搜尋領域扮演重要的角色。2.3節對元搜尋引擎建構和操作的web環境進行仔細分析，目的是弄清楚建構元搜尋引擎特别是大規模元搜尋引擎将會遇到的困難和挑戰。

《大規模元搜尋引擎技(1)》一第2章元搜尋引擎體系結構

繼續閱讀

《推薦系統》--混合推薦、解釋及如何評估推薦系統混合推薦方法推薦系統的解釋評估推薦系統案例分析：移動網際網路個性化遊戲推薦

《推薦系統》--基于知識的推薦概述知識表示法和推理與基于限制推薦系統互動與基于執行個體的推薦系統互動小結

前端性能優化之函數防抖

B+樹索引搜尋（Index Seek）與索引掃描（Index Scan）

ElasticSearch（ES）反向索引原理

下方進我的商品櫥窗看看真便宜。今晚8點，淘寶天貓618正式開賣。記者從淘寶天貓處獲悉，從首頁展示到搜尋推薦提升，從榜單推

es的幾個騷操作

技術解密｜阿裡雲多媒體 AI 團隊是憑借什麼拿下 CVPR2021 5冠1亞的？頂級挑戰賽戰績顯赫四大挑戰的關鍵技術探索基于視訊了解技術打造多媒體 AI 雲産品

mPaaS 月度小報 | 3月發生的大事件

Android WebView 緻安卓應用閃退，mPaaS 助你規避這波 Bug

算法專家解讀 | 開放搜尋教育搜題能力和實踐

解讀 WebRTC 音頻 NetEQ 及優化實踐為什麼要 “白話” NetEQ?丢包、抖動和優化的了解NetEQ 及相關子產品NetEQ 内部子產品NetEQ 相關子產品優化點總結

企業上雲的智能指揮官——混合雲管理平台

快手搜尋推薦算法的原理。在快手搜尋中，除了熱門推薦外，還有一個龐大的流量池。這個流量池不僅限于頭部作者，普通作者的作品也

目前音樂推薦系統研究中的挑戰和願景摘要1. 介紹2. 重大的挑戰3. 未來方向和願景

MovieTaster-使用Item2Vec做電影推薦 MovieTaster-使用Item2Vec做電影推薦

《大規模元搜尋引擎技(1)》一第2章 元搜尋引擎體系結構

繼續閱讀

《大規模元搜尋引擎技(1)》一第2章元搜尋引擎體系結構