天天看點

善用GOOGLE–從入門到精通

GOOGLE簡介

​​Google​​​ (​​www.google.com​​​)是一個搜尋引擎,由某大學博士生Larry Page與Sergey Brin于1998年9月發明,​​Google​​​ Inc. 于1999年創立。2000年7月份,​​Google​​替代Inktomi成為Yahoo公司的搜尋引擎,同年9月份,Google成為中國網易公司的搜尋引擎。98年至今,GOOGLE已經獲得30多項業界大獎。

  GOOGLE特色

  基本搜尋:+,  -,  OR

  1. 無需用“+”來表示邏輯“與”,隻要空格就可以了。

  範例:搜尋所有包含關鍵詞“易筋經”和“吸星***”的中文網頁

  搜尋:“易筋經 吸星***”

  結果:已搜尋有關易筋經 吸星***的中文(簡體)網頁。共約有726項查詢結果,這是第1-10項。搜尋用時0.13秒。

  注意:文章中搜尋文法外面的引号僅起引用作用,不能帶入搜尋欄内。

  2. 用減号“-”表示邏輯“非”。

  範例:搜尋所有包含“易筋經”而不含“吸星***”的中文網頁

  搜尋:“易筋經 -吸星***”

  結果:已搜尋有關易筋經 -吸星***的中文(簡體)網頁。共約有5,440項查詢結果,這是第1-10項。搜尋用時0.13秒。

  注意:這裡的“+”和“-”号,是英文字元,而不是中文字元的“+”和“-”。此外,”+”或”-“兩側的關鍵詞之間不能有空格。比如“易筋經 – 吸星***”,搜尋引擎将視為邏輯“與”,中間的“-”被忽略。

  3. 用大寫的“OR”表示邏輯“或”。但是,關鍵詞為中文的”或”查詢似乎還有BUG,無法得到正确的查詢結果。

  範例:搜尋包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網頁。

  搜尋:“britney OR beatles”

  結果:已搜尋有關britney OR beatles的中文(簡體)網頁。共約有14,600項查詢結果,這是第1-10項。搜尋用時0.08秒。

  搜尋:“布蘭妮 OR 披頭士”

  結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網頁。

  注意:小寫的“or”,在查詢的時候将被忽略;這樣上述的****作實際上變成了一次“與”查詢。

  4.  “+”和“-”的作用有的時候是相同的,都是為了縮小搜尋結果的範圍,提高查詢結果命中率。

  例:查閱天龍八部具體是哪八部。

  分析:如果光用“天龍八部”做關鍵詞,搜尋結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。

  如果你知道八部中的某一部,比如阿修羅,增加“阿修羅”關鍵詞,搜尋結果就隻有995項,可以直接找到全部八部,“天龍八部 阿修羅”。如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,查詢結果為1,010項,可以迅速找到需要的資料,“天龍 八部 佛教 -金庸”。

   輔助搜尋:萬用符号、大小寫、句子、忽略字元以及強制搜尋

  1. 不支援萬用符号,如“*”、“?”等,隻能做精确查詢,關鍵詞後面的“*”或者“?”會被忽略掉。

  2. 忽略英文字元大小寫,“GOD”和“god”搜尋的結果是一樣的。

  3. 關鍵詞可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵詞,必須加英文引号。

  範例:搜尋包含“long, long ago”字元串的網頁。

  搜尋:“"long, long ago"”

  結果:搜尋"long, long ago". 共約有28,300項查詢結果,這是第1-10項。搜尋用時0.28秒。

   注意:和搜尋英文關鍵詞串不同的是,GOOGLE對中文字元串的處理并不十分完善。比如,搜尋“"啊,我的太陽"”,我們希望結果中含有這個句子,事實 并非如此。查詢的很多結果,“啊”、“我的”、“太陽”等詞語是完全分開的,但又不是“啊 我的 太陽”這樣的與查詢。顯然,GOOGLE對中文的支援尚有欠缺之處。

  4. 對一些網絡上出現頻率極高的詞(主要是英文單詞),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略處理,如果使用者必須要求關鍵詞中包含這些常用詞,就要用強制文法“+”。

  範例:搜尋包含“Who am I ?”的網頁。如果用“"who am i ?"”,“Who”、“I”、“?”會被省略掉,搜尋将隻用“am”作關鍵詞,是以應該用強制搜尋。

  搜尋:“"+who +am +i"”

  結果:搜尋"+who +am +i". 共約有362,000項查詢結果,這是第1-10項。搜尋用時0.30秒。

  注意:英文符号(如問号,句号,逗号等)無法成為搜尋關鍵詞,加強制也不行。

  關鍵詞搜尋技巧

  關鍵詞的選擇在搜尋中起到決定性的作用,所有搜尋技巧中,關鍵詞選擇是最基本也是最有效的。

  “特定詞法”的關鍵詞選擇技巧

  範例:查找《鏡花緣》一書中淑士國酒保的酸話原文。

  分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜尋引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果了 解目标資訊的構成,用一些目标資訊所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜尋關鍵詞不一定就是目标資訊的主題。在上面的例子 中,酒保談到酒的濃淡與貴賤的關系時,之乎者也橫飛。是以,可以用特定的詞語一下子找到目标資料。

  搜尋:“酒 貴 賤 之”,OK,找到的第一條資訊就是鏡花緣的這一段落:“先生聽着:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,是以貴之。..”

  “近義詞法”的關鍵詞選擇技巧

  範例:“黃花閨女”一詞中“黃花”是什麼意思。

  分析:“黃花閨女”是一個約定的俗語,如果隻用“黃花閨女 黃花”做關鍵詞,搜尋結果将浩如煙海,沒什麼價值,是以必須要加更多的關鍵詞,限制搜尋結果。選擇什麼關鍵詞好呢?備選的有“意思”、“含義”、“來 曆”、“由來”、“典故”、“出典”、“淵源”等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字裡,是以用諸如“來曆”、“由來”、“出 典”等詞彙的機率更高一些。

  搜尋:“黃花閨女 黃花 由來”,查到“黃花”原來出典于《太平禦覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用“太平禦覽 壽陽公主”做搜尋了。

  “相關詞法”的關鍵詞選擇技巧

  範例:劉德華的胸圍是多少。

  分析:首先聲明,這是某個MM要我做的搜尋,我把它作為搜尋案例而已,沒其他的意思。非常直接的搜尋是,“劉德華 胸圍”,但事實上,這麼搜尋出來的結果,盡是一些諸如“劉德華取笑莫文蔚胸圍太小”之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料 應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關資訊。這樣就可以進一步的增加其他限制性關鍵詞以縮小搜尋範 圍。

  搜尋:“劉德華 胸圍 身高”,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》裡居然含有這樣關鍵詞,阿泰“改編自劉德華《忘情水》的變态歪歌”、“用身高體重 三圍和生日來加以編号”。好辦,把這部小說去掉,“劉德華 胸圍 身高 -阿泰”,OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用“阿泰”而不用“第一次親密接觸”呢?這是因為小說的名字被轉載的時候可能有變動,但 裡面角色的名字是不會變的。

  進階搜尋:site,link,inurl,allinurl,intitle,allintitle

  1.“site”表示搜尋結果局限在某個具體網站或者網站頻道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某個域名,如“com.cn”、“com”等等。如果是要排除某網站或者域名範圍内的頁面,隻需用“-網站/域名”。

  範例:搜尋中文教育科研網站(edu.cn)上所有包含“金庸”的頁面。

  搜尋:“金庸 site:edu.cn”

  結果:已搜尋有關金庸 site:edu.cn的中文(簡體)網頁。共約有2,680項查詢結果,這是第1-10項 。搜尋用時0.31秒。

  範例:搜尋包含“金庸”和“古龍”的中文新浪網站網頁,

  搜尋:“金庸 古龍 site:sina.com.cn”

  結果:已在sina.com.cn搜尋有關金庸 古龍的中文(簡體)網頁。共約有869項查詢結果,這是第1-10項。搜尋用時0.34秒。

   注意:site後的冒号為英文字元,而且,冒号後不能有空格,否則,“site:”将被作為一個搜尋的關鍵詞。此外,網站域名不能有“http”以及 “www”等,也不能有任何“/”的目錄後顯示;網站頻道則隻局限在“頻道名.域名”方式,而不能是“域名/頻道名”方式。諸如“金庸 site:edu.sina.com.cn/1/”的文法是錯誤的。

  2. “link”文法傳回所有連結到某個URL位址的網頁。

  範例:搜尋所有含指向華軍軟體園​​www.newhua.com​​​”連結的網頁。

  搜尋:“link:www.newhua.com”

  結果:搜尋有連結​​​http://www.newhua.com​​​的網頁。共約有…j尋時用0.23秒。

  注意:“link”不能與其他文法相混合****作,是以“link:”後面即使有空格,也将被GOOGLE忽略。

  3. inurl文法傳回的網頁連結中包含第一個關鍵詞,後面的關鍵詞則出現在連結中或者網頁文檔中。

  有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語 法找到這些相關資源連結,然後,用第二個關鍵詞确定是否有某項具體資料。INURL文法和基本搜尋文法的最大差別在于,前者通常能提供非常精确的專題數 據。

  範例:查找MIDI曲“滄海一聲笑”。

  搜尋:“inurl:midi 滄海一聲笑”

  結果:已搜尋有關inurl:midi 滄海一聲笑的中文(簡體)網頁。共約有14項查詢結果,這是第1-10項。搜尋用時0.01秒。

  範例:查找微軟網站上關于windows2000的安全專題資料。

  搜尋:“inurl:security windows2000 site:microsoft.com”

  結果:已在microsoft.com内搜尋有關 inurlecurity windows2000的網頁。共約有198項查詢結果,這是第1-10項。搜尋用時0.37秒。

  注意:“inurl:”後面不能有空格,GOOGLE也不對URL符号如“/”進行搜尋。GOOGLE對“cgi-bin/phf”中的“/”當成空格處理。

  4. allinurl文法傳回的網頁的連結中包含所有查詢關鍵詞。這個查詢的對象隻集中于網頁的連結字元串。

  範例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程式(這個腳本是不安全的),表現在連結中就是“域名/cgi-bin/phf”。

  文法:“allinurl:"cgi-bin" phf +com”

  搜尋:搜尋allinurl:"cgi-bin" phf +com. 共約有40項查詢結果,這是第1-10項。搜尋用時0.06秒。

  5. allintitle和intitle的用法類似于上面的allinurl和inurl,隻是後者對URL進行查詢,而前者對網頁的标題欄進行查詢。

  頁标題,就是HTML标記語言title中之間的部分。網頁設計的一個原則就是要把首頁的關鍵内容用簡潔的語言表示在頁标題中。是以,隻查詢标題欄,通常也可以找到高相關率的專題頁面。示例:查找日本明星藤原紀香的照片集。

  搜尋:“intitle:藤原紀香 寫真”

  結果:已搜尋有關intitle:藤原紀香 寫真的中文(簡體)網頁。共約有284項查詢結果,這是第1-10項。搜尋用時0.03秒。

  少用進階搜尋文法:related,cache,inforelated

  用來搜尋結構内容方面相似的網頁。

  範例:搜尋所有與中文新浪網首頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),“related:www.sina.com.cn/index.shtml”。

  cache用來搜尋GOOGLE伺服器上某頁面的緩沖暫存,這個功能同“網頁快取”,通常用于查找某些已經被删除的死連結網頁,相當于使用普通 搜尋結果頁面中的“網頁快取”功能。info用來顯示與某連結相關的一系列搜尋,提供cache、link、related和完全包含該連結的網頁的功 能。

  範例:查找和新浪首頁相關的一些資訊。

  搜尋:“info:www.sina.com.cn”

  結果:有​​​www.sina.com.cn​​的網頁資訊。

  新浪首頁北京站 上海站 廣東站. … 遊戲世界, |, 影音娛樂, |, Club緣, |, 男人女人, |, 論壇聊天, |,時尚潮流, |, 文教育兒, |, 車行天下, |, 軟體下載下傳. …

​​Google​​​ 提供這個網址的資訊:

  檢視​​​Google​​​網頁快照​​www.sina.com.cn​​​的存檔

  尋找​​​www.sina.com.cn​​​類似的網頁

  尋找網頁有連結​​​www.sina.com.cn​​​   尋找網頁包含有​​www.sina.com.cn'​​

  其他重要功能

  目錄服務

  如果不想搜尋頁,而是想尋找某些專題網站,可以浏覽GOOGLE的分類目錄​​http://directory.google.com/​​

  GOOGLE為了友善搜尋者,提供了工具Bar,內建于浏覽器中,使用者無需打開GOOGLE首頁就可以在工具Bar内輸入關鍵詞進行搜尋。此 外,工具Bar還提供了其他許多功能,如顯示頁面PageRank等。最友善的一點在于使用者可以快捷的在GOOGLE首頁、目錄服務、新聞討論區搜尋、進階搜 尋和搜尋設定之間切換。欲安裝GOOGLE的工具Bar,可以浏覽​​http://toolbar.google.com/​​​  

  新聞討論區(USENET)搜尋

  新聞討論區中有大量的有價值資訊,DEJA一直是新聞討論區搜尋引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收購并提供了所有DEJA的功能。現在,除了搜尋之外,GOOGLE還支援新聞討論區的WEB方式浏覽和張貼功能。

  輸入“http://groups.google.com/”後,點按“Advanced Groups Search”進入進階搜尋界面​​http://groups.google.com/advanced_g…lt.chinese.textauthor:[email protected]​​”。

  一般而言,我更推薦使用圖形搜尋界面,友善而且直接觀看。

  搜尋結果翻譯

  曾經為那些你不懂的法文、西班牙文頁面煩惱麼? GOOGLE支援一項搜尋結果翻譯功能,可以把非英文的搜尋結果翻譯成英文!!目前隻支援有限的拉丁語、法語、西班牙語、德語和葡萄牙文。不過,隻能在英文狀态GOOGLE下實作這個功能。進入GOOGLE的設定頁面,​​http://www.google.com/preferences​​,有一個“BETA: Enable translation of search results you’re your interface language. ”的選項,把它選中,就OK了。

  搜尋結果過濾

  網絡上的成人内容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,浏覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人内容過濾功能,見GOOGLE的設定網頁,​​http://www.google.com/preferences​​​。不過,中文狀态下的GOOGLE尚沒有這個功能。

 

  PDF檔案搜尋

  GOOGLE提供對PDF檔案内文的檢索。目前GOOGLE檢索的PDF文檔大約有2500萬左右。PDF是ADOBE公司開發的電子文檔案格式,現在已經成為網際網路上的電子化出版标準。PDF文檔通常是一些圖文并茂的綜合性檔案,提供的資訊一般比較集中全面。

  範例:搜尋關于電子商務(ECOMMERCE)的PDF文檔。

  搜尋:“inurldf ecommerce”

  結果:搜尋inurldf ecommerce. 共約有19,200項查詢結果,這是第1-10項。搜尋用時0.11秒。

  下面是某項搜尋結果:

  [PDF]www.usi.net/pdf/outsoucing-ecommerce.pdf  Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product Marketing Professonial (PMP) Implementation Manager, Web Engineering …一般文本檔案 – 類似網頁可以看到,GOOGLE在PDF檔前加上了[PDF]的标記,而且,GOOGLE把PDF檔案轉換成了文本檔案,點選“一般文本檔案”,可以粗略 的檢視該PDF文檔的大緻内容。當然,PDF原有的圖檔以及格式是沒有了。

  圖像文檔案搜尋

  GOOGLE提供了Internet上圖像檔案的搜尋功能!通路位址是“images.google.com”。你可以在關鍵詞字段内輸入描述 圖像内容的關鍵詞,如“britney spears”,也可以輸入描述圖像品質或者其他屬性的關鍵詞,如“high quality”。

  GOOGLE給出的搜尋結果具有一個直覺的縮略圖(Thumbnail),以及對該縮略圖的簡單描述,如圖像檔案名稱,以及大小等。點選縮略 圖,頁面分成兩祯,上祯是圖像之縮略圖,以及頁面連結,而下祯,則是該圖像所處的頁面。螢幕右上角有一個“Remove Frame”的按鈕,可以把架構頁面迅速切換到單祯的結果頁面,非常友善。GOOGLE還提供了對成人内容圖像的限制功能,可以讓搜尋者免受不必要的騷 擾。不過,非常遺憾的是,圖像搜尋功能還不支援中文。

  找人

  分析:一個人在網上揭示的資料通常有:姓名,網名,性别,年齡,畢業學校,工作機關,外号,住址,電話,電子信箱,BP,手機号碼,ICQ号,OICQ号等等。是以,如果你要了解一下你多年沒見過的同學,那不妨用上述資訊做關鍵詞進行查詢,也許會有大的收獲。

  找軟體

  分析一:最簡單的搜尋當然就是直接以軟體名稱以及版本号為關鍵詞查詢。但是,僅僅有軟體名稱和目标網站,顯然還不行,因為搜尋到的可能是軟體的 相關新聞。應該再增加一個關鍵詞。考慮到下載下傳頁面上常有“點選此處下載下傳”或者“download”的提示語,是以,可以增加“下載下傳”或者 “download”為關鍵詞。

  搜尋:“winzip 8.0 下載下傳”

  結果:已搜尋有關winzip 8.0 下載下傳的中文(簡體)網頁。共約有6,670項查詢結果,這是第1-10項。搜尋用時0.22秒。

  分析二:很多網站設有專門的下載下傳目錄,而且就命名為“download”,是以,可以用INURL文法直接搜尋這些下載下傳目錄。

  搜尋:“winzip 8.0 inurlownload”

  結果:已搜尋有關winzip 8.0 inurlownload的中文(簡體)網頁。共約有358項查詢結果,這是第1-10項。搜尋用時0.44秒。

  在網際網路上随意的下載下傳軟體是不安全的,因為供下載下傳的軟體有可能帶有病毒或者捆綁了木馬,是以,對下載下傳網站作一個限定,是一個穩妥的思路。可以用SITE文法達到這個目的。

  共享件下載下傳完之後,使用的時候,軟體總跳出警示框,或者軟體的功能受到一定限制。由于中國的網民多是窮棒子,是以應該再找一個注冊碼。找注冊 碼,除了軟體的名稱和版本号外,還需要有諸如“serial number”、“sn”、“序列号”等關鍵詞。現在,來搜尋一下winzip8.0的注冊碼。

  搜尋:“winzip 8.0 sn”

  結果:搜尋winzip 8.0 sn. 共約有777項查詢結果,這是第1-10項。搜尋用時0.30秒。

  找圖檔

  除了GOOGLE提供的專門圖檔搜尋功能,還可以組合使用一些搜尋文法,達到圖檔搜尋之目的。

  分析一:專門的圖檔集合,提供圖檔的網站通常會把圖檔放在某個專門目錄下,如“gallary”、“album”、“photo”“image”等。這樣就可以使用INURL文法迅速找到這類目錄。現在,試着找找小甜甜布蘭妮的照片集。

  搜尋:“"britney spears" inurlhoto”

  結果:搜尋"britney spears" inurlhoto. 共約有2,720項查詢結果,這是第1-10項。搜尋用時0.23秒。

  分析二:提供圖檔集合的網頁,在标題欄内通常會注明,這是誰誰的圖檔集合。于是就可以用INTITLE文法找到這類網頁。

  搜尋:“intitle:"britney spears" picture”

  結果:搜尋intitle:"britney spears" picture. 共約有317項查詢結果,這是第1-10項。搜尋用時0.40秒。

  分析三:明星的FANS通常會申請免費個人首頁來存放他們偶像的靓照。于是用SITE文法指定某免費首頁提供站點,是個迅速找到圖檔的好辦法。

  搜尋:“"britney spears" site:geocities.com”

  結果:已在geocities.com内搜尋有關"britney spears"的網頁。共約有5,020項查詢結果,這是第1-10項。搜尋用時0.47秒。 

  找MP3

  分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門别類的存放各種MP3樂曲。是以,可以用INURL文法迅速找到這類目錄。現在用這個辦法找找老歌“say you say me”。

  搜尋:“"say you say me" inurl:mp3”

  結果:搜尋inurl:mp3 "say you say me". 共約有155項查詢結果,這是第1-10項。搜尋用時0.17秒。

  分析二:也可以通過頁标題,找到這類提供MP3的網頁。

  搜尋:“"say you say me" intitle:mp3”

  結果:搜尋"say you say me" intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜尋用時0.73秒。

  當然,如果你知道某個網站的下載下傳速度快,而且樂曲全,就可以用SITE文法先到該網站上看看有沒有目标樂曲。

  找書

  分析一:找書的關鍵,是你了解一大批著名的圖書館網站。對我而言,常通路的電子圖書館類網站就那麼幾個,比如文藝類的​​www.shuku.net​​”。用SITE文法 site:shuku.net”,就可以馬上找到該書。

  分析二:我上面介紹的第一項關鍵詞選擇技巧特定詞法,對于迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的内容有印象的基礎上。比如如果了解唐吉诃德一書的大緻内容,就可以用“吉诃德 風車 桑喬”迅速找到該書。

  GOOGLE搜尋FAQ

  Q:如何全面的了解google.com?

  A:檢視網站相關頁面“http://www.google.com/about.html”。

  Q:如何切換google.com的初始語言界面?

  A:點選搜尋欄右邊的“使用偏好”(Preferences),選擇“界面語 言”(Interface Language)中你期望的語言,點選最下面的“設定使用偏好”(Save Preferences)按鈕。需要提醒的是,GOOGLE用cookie記錄這個偏好,是以如果你把浏覽器的cookie功能關掉,就無法進行設定。

  Q:如何設定每頁搜尋結果顯示數量?

  A:同上,進入使用偏好,在該頁的“檢視結果”(Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,預設是10項。

  Q:搜尋到的連結無法打開怎麼辦?

  A:連結無法打開的原因很多,比如網站當機,或者ISP過濾等,可以點選GOOGLE的“網頁快取”檢視在GOOGLE伺服器上的網頁緩存。

繼續閱讀