Google搜尋技術
搜尋引擎隻是一個索引資料庫,一般沒有自己的資訊資源,資訊的可獲得性與搜尋引擎無關。不過搜尋引擎有時也會在資料庫中存儲某些資訊的内容。
排除常用詞規則:
在Google的檢索規則中,有些常用詞如“的”、“the”或者“of”等這些詞是不被當作檢索詞的,而被忽略掉。
不區分大小寫規則:
Google對于檢索詞中的大小寫是完全不做區分的,這個規則的設定是為了改善檢索結果,因為利用這樣一個規則,就可以檢索到包含該詞的所有網頁,避免了因為大小寫不規範而造成的在查全率上的損失
排除标點符号規則:
Google并不認為标點符号具有與文字一的重要地位,是以Google會忽略檢索之間絕大多數的标點符号。但是對于單引号和連字元而言,它們是不被省略的。
檢索詞的詞序和鄰近規則:
在Google中,檢索詞的排序方式對于整個檢索式具有重要的影響,它将首先比對按照檢索式給出的次序進行搜尋。同時它也将優先比對檢索詞互相鄰接的網頁。
邏輯與:空格、AND。
(在Google的檢索規則中,最基本的一條是預設And規則,即當你輸入多個檢索詞之後,Google預設為要檢索所有的包含所有檢索詞的網頁,它們之間為And連接配接。)
邏輯或:OR
在檢索式中運算符OR必須以大寫的形式出現,否則會把它看成是普通的檢索詞。OR運算符告訴Google查找包含其中任何一個詞的網頁。
邏輯非:-(減号)。
運算符“-”表示不包含該運算符後面的詞。
Daterange:查找在一定的日期或者一定的日期範圍内,Google索引的網頁(該文法隻關注被Google收錄的時間,而不關注網頁建立的時間)。
縮小搜尋範圍最好的選擇:混合使用intitle、site。例如,intitle:自動化site:edu.cn;
限定搜尋特定類别的資訊:inurl限定。例如,等愛的玫瑰 inurl:mp3;
搜尋網站内的文檔(一網打盡!):例如,filetype:ppt site:lib.nit.net.cn。
不混合使用有抵消的搜尋:例如,知識管理site:edu.cn -inurl:edu;
不要重複使用同一文法結構:例如,知識管理 site:cn site:com,但是這樣可以:知識管理 (site:cn | site:com);
在混合使用文法時,不要用别名:如allinurl、allintitle;
不要使用過多的文法将搜尋結果限制得特别狹窄,采取逐漸增加限制的方法,一般不要一步到位做很多限制。
Google 學術搜尋:學術文章搜尋,可能會獲得全文。http://scholar.google.cn/
Google 圖檔搜尋:搜尋圖檔,對做課件和藝術系同學很有幫助。https://www.google.com.hk/imghp?hl=zh-CN
Google 圖書搜尋:有可能獲得所需要圖書的全文。 http://books.google.cn/
Google 地圖搜尋:查詢位址、捜索周邊和規劃路線。http://ditu.google.cn/
Google 地球:從遠、近等多個角度檢視地球的各個角落。http://earth.google.com
Google 視訊:從遠、近等多個角度檢視地球的各個角落。http://video.google.com
Google不區分英文字母的大小寫,所有字母均作小寫對待。例如:輸入“george washington”(喬治·華盛頓),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,結果都是一樣的
通配符問題。Google對通配符的支援有限,隻能用“”代替單個字元,而且必須将檢索詞用引号引起來,如“以治國”
搜尋引擎忽略的字元與強制檢索。
Google對一些出現頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略處理。如果檢索詞中包含這些字元,必須進行強制檢索,在這些字元前後用“+”,如“+www+的曆史”,或用英文的引号
===========
Baidu搜尋技巧
每個被收錄的網頁,在百度上都存有一個純文字的備份,稱為“百度快照”。百度隻保留文本内容,是以,那些圖檔、音樂等非文本資訊,快照頁面還是直接從原網頁調用。如果您無法連接配接原網頁,那麼快照上的圖檔等非文本内容,會無法顯示。
技巧:如果有一些網站需要積分才能下載下傳文章,這個時候用百度快照可以免費下載下傳文章。
搜尋結果不佳,有時候是因為選擇的查詢詞不是很妥當。您可以通過參考别人是怎麼搜的,來獲得一些啟發。百度的“相關搜尋”,就是和您的搜尋很相似的一系列查詢詞。百度相關搜尋排布在搜尋結果頁的下方,按搜尋熱門度排序。
百度還有線上英漢互譯詞典?沒錯。您也可以通過百度詞典搜尋界面(http://dict.baidu.com) ,直接使用英漢互譯功能。如,搜尋“computer”,就可以得到高品質的翻譯結果。百度的線上詞典不但能翻譯普通的英語單詞、詞組、漢字詞語,甚至還能翻譯常見的成語!
可以計算四則運算,如,35*82-(32+11);還可以進行公式計算。如,log((sin(5))^2)-3+pi;甚至可以進行機關換算,換算前機關=?換算後機關 ,如,1海裡=?公裡;等等。
在百度搜尋框中輸入股票代碼、列車車次或者飛機航班号,您就能直接獲得相關資訊。例如,輸入深發展的股票代碼“000002”,搜尋結果上方,顯示萬科A的股票行情。
有時候,您如果知道某個站點中有自己需要找的東西,就可以把搜尋範圍限定在這個站點中,提高查詢效率。使用的方式,是在查詢内容的後面,加上“site:站點域名”。
注意,“site:”後面跟的站點域名,不要帶“http://”;另外,site:和站點名之間,不要帶空格。
有兩層特殊功能,一是書名号會出現在搜尋結果中;二是被書名号擴起來的内容,不會被拆分。 書名号在某些情況下特别有效果。
網頁标題通常是對網頁内容提綱挈領式的歸納。把查詢内容範圍限定在網頁标題中,有時能獲得良好的效果。使用的方式,是把查詢内容中,特别關鍵的部分,用“intitle:”領起來。
例如,找林青霞的寫真,就可以這樣查詢:寫真 intitle:林青霞
注意,intitle:和後面的關鍵詞之間,不要有空格。
網頁url中的某些資訊,常常有某種有價值的含義。于是,您如果對搜尋結果的url做某種限定,就可以獲得良好的效果。實作的方式,是用“inurl:”,後跟需要在url中出現的關鍵詞。
例如,找關于photoshop的使用技巧,可以這樣查詢:photoshop inurl:jiqiao
上面這個查詢串中的“photoshop”,是可以出現在網頁的任何位置,而“jiqiao”則必須出現在網頁url中。注意,inurl:文法和後面所跟的關鍵詞,不要有空格。
用法同Google
如果您發現搜尋結果中,有某一類網頁是您不希望看見的,而且,這些網頁都包含特定的關鍵詞,那麼用減号文法,就可以去除所有這些含有特定關鍵詞的網頁。
例如,搜 神雕俠侶,希望是關于武俠小說方面的内容,卻發現很多關于電視劇方面的網頁。那麼就可以這樣查詢:神雕俠侶 -電視劇
注意,前一個關鍵詞,和減号之間必須有空格,否則,減号會被當成連字元處理,而失去減号文法功能。減号和後一個關鍵詞之間,有無空格均可。
百度會嚴格按照您送出的查詢詞去搜尋,是以,查詢詞表述準确是獲得良好搜尋結果的必要前提。 一類常見的表述不準确情況是,腦袋裡想着一回事,搜尋框裡輸入的是另一回事。 一種不準确的表述就是在查詢中出現錯别字。
目前的搜尋引擎并不能很好的處理自然語言。是以,在送出搜尋請求時,您最好把自己的想法,提煉成簡單的,而且與希望找到的資訊内容主題關聯的查詢詞。還是用實際例子說明。某三年級國小生,想查一些關于時間的名人名言,他的查詢詞是“國小三年級關于時間的名人名言”。最好的查詢詞,應該是“時間名言”。
百度支援對Office文檔(包括Word、Excel、Powerpoint)、Adobe PDF文檔、RTF文檔進行的全文搜尋。要搜尋這類文檔,很簡單,在普通的查詢詞後面,加一個“filetype:”文檔類型限定。Filetype:”後可以跟以下檔案格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜尋所有這些檔案類型。
探尋有趣之事!