天天看點

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

作者:紀史新說

文 | 王十七

編輯 | 王十七

網格的定義

網格(Grid)概念最早20世紀90年代中期提出,是從電力網(Power Grid)概念借鑒過來的。

其主要特點是把整個網際網路內建為一台巨大的超級計算機,以實作全球範圍的計算資源、存儲資源、資料資源、資訊資源、知識資源、專家資源、裝置資源的全面共享。

美國阿崗(Argonne)國家實驗室的資深科學家、美國Globus項目的上司人I.Foster多次撰文探讨網格的定義,他認為網格必須同時滿足3個條件:①在非集中控制的環境中協同使用資源;②使用标準的、開放的和通用的協定和接口;③提供非平凡的服務。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

網際網路實作了計算機硬體的連通,Web實作了網頁的連通,而網格試圖實作網際網路上所有資源的全面連通,在動态的、異構的虛拟組織間實作協同的資源共享 以及協同解決問題。

共享是網格強調的重點,但是這種共享又必須是高度可控的,需要在資源提供者和消費者之間詳細定義哪些部分是可以被共享的,在什麼條件下可以共享以及相應的管理機制、付費機制。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

網格要解決的主要問題與開展電子商務有一定的相似性,即整合所有資訊服務環節和相關技術需要建立統一的服務标準協定。

盡管目前大多數的網格還處于試驗階段,但網格所追求的一步到位的服務理念是未來資訊檢索的目标和方向。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

網格的好處

在未來的發展中,網格可能不是單一的依靠伺服器模式,或單一的依靠網絡協定模式。

而是二種模式的互相結合——在有共同認可的協定基礎上實作伺服器之間的互相連通。

網格技術的實作極大地開拓了未來數字圖書館資訊檢索服務領域的前景。

傳統的檢索語言中有人工語言和自然語言的劃分。

人工語言叉分為關鍵詞、主題詞、叙詞等。

同時檢索語言還必須排除一詞多義、一義多詞和詞義模糊等現象。

對于一個成熟的資訊檢索員,要準确掌握資訊檢索語言,還需進行相當系統的學習。

而一個普通的使用者則很難區分這些詞對于計算機檢索的不同。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

網格技術應用的語義網技術可以使得檢索變得如同上網浏覽一樣輕車熟路,它會根據輸入的檢索詞自動查對語義相關的詞語。

并對知識挖掘、過濾、推薦,一次搜尋到全球範圍内可用的,可映射到的最小、最完備的知識集合。

對傳統的資訊檢索對于檢索者來說,資料資源存在的位址也是十分重要的。

如果資訊資源的URL發生改變,我們将無從查找。

由于網格技術将現在資源整合成一個最大的複用資源。

使用者無需知道URL,一次登入就可進行全球分布式的資訊通路。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

網格技術減輕了檢索人員的工作負擔,網格技術簡化了傳統的檢索語言,可以使使用者直接進行資訊檢索,與此同時,即便是檢索人員進行資訊檢索,也省略了确定複雜多種檢索語言的麻煩。

由于網格技術省略了URL的記憶,檢索人員不必記憶某一資源的位址,也不必記憶查找專利要用專利資料庫,查找标準要用萬方資料庫,查找期刊論文和 學位論文的資料庫有所差別這些繁瑣的事情。

現有的Web資訊伺服器就好像Internet上一個個孤立的小島。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

雖然這些“小島”暫時還有充足的帶寬資源可用,但大量的資訊還是被“鎖”在 自己内部的資料庫裡,各“孤島”之間并不能按照使用者的指令進行有意義的交流。

缺乏一個統一的網絡管理神經中樞,資訊資源零散分布處于無序狀态,而網格技術能夠使廣泛的網絡資源共享和協作。

網格将分布在不同地理位置的計算資源,通過高速的網際網路組成充分共享的資源內建,進而提供一種高性能計算、管理及服務的資源能力。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

它将網際網路中各站點上零散分布的資訊資源,進行統一管理和使用,利用資料挖掘、 資訊融合和資源引擎等技術完成網絡資源的搜集與共享,并利用單一系統映像技術完成資訊的單一映像和有效融合,保證邏輯資源的實體可用性,便于用網格引擎實作資源的擷取。

使用者可以通過網格門戶,看到若幹與自己相關的主題,而不必在無數個網站中大海撈針般地搜尋資訊。

許多平台和資源都可以共享,這樣可大大降低網站建立及提供服務的成本。

進而提高資訊檢索的效率,促進資訊資源共用共享。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

展望未來,網格作為Internet的第三次浪潮,對于全面解決網格的資源共享、人 機結合和資訊安全等問題将有重大的指導意義,也将為解決複雜系統問題的綜合內建技術打下堅實的技術基礎。

基于網格的資訊檢索正是充分利用網格的特性減少對網絡帶寬的依賴,它的叢集性極大地提高了伺服器性能,它的開放性又不必深究資訊的來源。

網格所帶來的不僅僅是一種嶄新的理念、一項新的技術方案,同時它也給資訊的檢索利用帶來了更為廣闊的發展空間。

盡管目前大多數的網格還處于試驗階段,但網格所追求的一步到位的服務理念 是未來資訊檢索的目标和方向。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

異地資源提供服務多采用導航方式向讀者提供異地資源的連結,由讀者那一端按照所提供的連結自行索取異地資源,就如同目前網上的搜尋引擎所做的那樣。

但這種做法受到一些條件的限制比如網絡帶寬、異地資源的統計結算,與異地服 務機構是否達成合作協定。

網格打破了“到資源所在位置使用資源”的限制,使用者可以對資源進行直接操控。

網格技術中有一重要組成部分中間件技術,它将不同資料庫、異構的網絡環境結合成一個有機的協同工作整體。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

通過建立跨越Web的資訊分布和內建應用程式邏輯,利用現有的網絡基礎設施、協定規範、Web和資料庫技術,為使用者提供一體化的智能資訊平台,其目标是建立一種架構在作業系統和Web之上的, 基于Internet的新一代資訊平台和軟體基礎設施。

在這個平台上,資訊的處理是分布式、協作和智能化的,無縫組成統一的資訊服 務視圖,提供跨平台聯合檢索服務,實作全面的資訊資源共享。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

目前的國内外研究現狀

目前,國外的網格研究主要集中在美國和歐洲等發達國家。

這些國家在網格研究階段度投入了大量的财力、物力和人力,并取得了一些初步成果。

最“正統”的網格研究來源于美國聯邦政府過去 1 0年來資助的高性能計算項目。

這方面的代表性研究工作包括美國國家科學基金會資助的NPACI、“國家技術網格”(NTG)、分布萬億次級計算設施(DTF)、美國宇航總署的IDG、美國能源部的ASCIGrid以及歐盟的Data Grid等。

其中最著名、最具代表性的網格計算研究是美國的Globus項目。

Globus是美國Argonne國家實驗室的研發項目,全美有 12所大學和研究機構參 與了該項目。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

Globus對資源管理、安全、資訊服務及資料管理等網格計算的關鍵理論進行研究,開發能在各種平台上運作的網格計算工具軟體(Toolkit),幫助規劃群組建大型的 網格試驗平台,開發适合大型網格系統運作的大型應用程式。

Globus的技術已在NASA網格(NASA IPG)、歐洲資料網格(Data Grid)、美國國家技術網格(NTG)等8個項目中得到應用。

英國目前也已投資1億英鎊用來研制“英國國家網格(UKNational Grid)”。

美國軍方正規劃實施一個宏大的網格計劃,叫做“全球資訊網格(Global Information Grid)”。

目前,網格技術雖主要為學術機構所控制,但企業也在陸續跟進。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

衆多IT跨國巨頭躍躍欲試,紛紛公布自己以研究網格相關商業産品為核心的網格計劃。

2001年8月,IBM開始構築其旨在通過網際網路充分利用互相間閑置的電腦能源,向每一台個人電腦提供超級的處理能力Grid Computing計劃。

2002年1月和5月,IBM又分别釋出了全面支援網格計算的eScrver p690和p670 兩款超級伺服器。

另外,IBM還釋出了WebSphere平台和一系列中間件來支援網格計算。

在日本,NTT Data計劃與Intel和SGI聯合進行一項為期三個月的網格計算試驗,屆時将有包括家庭、企業和學術機構在内的100萬台計算機相聯,其總處理能力 将比現有的最快超級計算機還要快5倍。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

惠普、IBM、微軟、Sun等公司也達成取得共識,支援XML、SOAP、UDDI等網際網路标準,進而更有利于開發新一代的網絡應用。

不僅如此,Microsoft,Intel等企業還以投資形式扶持了一批面向第三代網際網路的 新企業,而更多的新興企業正以一種前所未有的創新熱情積極地投入到第三代網際網路的發展。

面對網格所帶來的創新機遇,中國的研發機構和相關企業也在把握時機。

從1995年開始,中國科學院計算所就建立了專門的網格研究隊伍開始研究與網格相關的技術。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

但是國内的網格計算尚處于研究階段,主要集中于中科院計算所、國防科大、江南計算所、清華大學等幾家在高性能計算方面有較強實力的研究機關,并把研發重點放在同時具有下述三個特點的領域:大量中國使用者迫切需要;國外研究還比較薄弱技術上可能産生突破性創新。

在大陸,已經完成的網格研究項目主要有:清華大學的先進計算基礎設施ACI和以中科院計算為主的國家高性能計算環境NHPCE,“先進計算基礎設施北京上海試點工程(簡稱‘清華ACI系統’)”由清華大學計算機系承擔的。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

在清華ACI系統中,清華大學研制的高性能計算機“THNPSC-2”與上海大學研制的高性能計算機“自強2000”通過高速網絡連接配接在一起,此外還連接配接了4個應用結點。

這6個地理位置不同的網格節點可以同時召開網絡會議。

除此之外還開發了相應的中間件,可以構成跨地區、跨學科的“虛拟實驗室”研究環境。

清華ACI系統具有一套健全的資源管理系統、任務管理系統、使用者管理系統及安全服務與監控系統。

已經于2001年6月通過了由著名計算機院士和專家組成的鑒定委員會的鑒定和驗收。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

國家高性能計算環境是國家級高性能計算和資訊服務的戰略性基礎設施,由國家863計劃資助,投入的研究經費超過5千萬元人民币。

它側重于研究面向科學研究的計算網格,由教育網和科技網上的9個不同的站點組成,提供超級計算機的共享操作。

中國科學院的國家高性能計算環境和清華ACI系統,兩個項目已經創造了在網上 “大合作”與“大會戰”的條件和環境。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

目前,分布在全國五個城市的國家高性能計算中心的超級計算機,已經初步實作統一的資源目錄管理。

中國目前在研的主要有五個網格項目:國家網格(科技部)、中國教育科研網格計劃、E-Science網格研究計劃、上海交通資訊網格、中國空間資訊網格,其中,國家網格是國家863計劃重大專項。

網絡日漸發展,網格技術在資訊檢索中的應用前景如何?

結語

目前的網格技術尚未成熟,一些關鍵的技術問題仍有待解決,如網格資源共享的知識産權問題,實作資源無障礙流通的語義網問題。

以及網格資源的安全問題等,但它在資訊檢索中的應用前景廣闊,這需要數字圖書館的同仁們進一步的研究。

繼續閱讀