摘要:我國絕大多數政府部門都已經建立起自己的業務系統,并在日常業務進行中發揮着重要的作用。由于受各種條件的限制,在建設初期各部門獨立建設自己的系統,導緻資訊孤島現象大量存在,嚴重制約了電子政務的進一步發展。通過針對具有同一服務對象建立業務資料交換平台,實作了政府部門間資料共享互聯互通需求,解決電子政務中“資訊孤島”問題。電子政務資料中心經過近幾年發展,從存儲資料概念演變成為資料加工、資料挖掘和決策支援,通知識管理組織和管理資料,并為政府部門和公衆提供多種資訊服務。
關鍵詞:業務資料交換平台資料中心業務資料整理中間件工作流管理資訊孤島搜尋引擎資料倉庫決策支援
資訊化程度的高低已經成為衡量一個國家綜合國力和國際競争力的主要名額之一。大力推進資訊化建設,是順應時代潮流和世界發展趨勢的重大決策,是實作工業化、現代化的必然選擇,是促進生産力跨越式發展、增強綜合國力和國際競争力的重要的戰略舉措。目前,據統計,我國的各級政府部門掌握着全體社會資訊資源的80%。在這些掌握社會資訊資源的各部門系統間,不同程度地存在着資訊交換和共享不暢的問題:最差的既不互聯,也不互通;稍好一點的網絡互聯但資訊資源不能互通;比較好的雖然資訊可以“互聯互通”,但各部門間的業務卻不能協同。如何提高政府部門資訊系統的工作效率,充分發揮資訊資源的作用,是目前電子政務發展的一個新課題。本文将重點讨論電子政務的資料交換和資料資源建設問題,有關電子政務資訊安全問題另文專題讨論。
一、電子政務發展曆程與趨勢
我國電子政務在二十年的時間裡,經曆了一個内涵不斷豐富、地位不斷提高、作用不斷增強的發展過程。二十年的電子政務發展雖然促成了一個繁榮的IT市場,但帶給我們則是更多的啟示和反思。雖然各級政府都大力推進了資訊化建設,但有效資訊的使用率低,政府部門内部以及部門之間資訊銜接不緊密、資訊彙總與實時的綜合處理能力弱,"資訊孤島"、重複建設、資源浪費、共享程度低、标準不統一等現象仍然比較突出,已成為我國電子政務建設中共性的關鍵性問題。通過建立标準規範的資訊共享互聯互通的資訊管理支撐體系,實作政府資訊資源建設、管理和應用的一體化,不斷提高政府部門經濟調節、市場監管、社會管理和公衆服務的水準,已成為我國電子政務建設的當務之急。
電子政務資訊共享互聯互通就是将數字化的政務資訊資源(包括政務工作流程,政府法規,政府公文,政府部門的職能配置設定,政府公務員和從業人員等各方面資源)進行共享、互動與流通,進而達到管理資訊的準确性、及時性、一緻性、和協同性,為正确的分析和決策提供可靠的依據,同時也為新決策的實施與部署,政府服務管理職能的優化提供資訊互動和部署的平台,使電子政務資訊化建設實作從前端應用,資訊共享與流程的互動,政務決策,到決策的實施與部署的端到端的全流程管理。
電子政務發展曆程與趨勢圖
第一階段 起步階段
二十世紀八十年代初計算機技術開始向民用領域廣泛普及,發達國家已開始将這一高科技技術應用于公共行政管理。受此影響,1987年國務院在北戴河召開了全國政府辦公廳系統辦公自動化工作會議暨全國政府辦公廳系統軟體交流會。1988年,全國政府辦公廳系統辦公自動化工作協調小組成立,從此我國開始了電子政務的建設。1992年,為了推進政府機關的自動化程度,在政府機關普及推廣計算機的使用,國務院辦公廳下發檔案《國務院辦公廳關于建設全國政府行政首腦機關辦公決策服務系統的通知》(國辦[1992]25号檔案)。
在九十年代初,随着計算機技術與網絡技術的迅猛發展,國内外基本上沒有誰坐下來認真思考計算機網絡技術到底該怎樣運用更有效,隻是蜂擁而上。廠商們為了争取更多的經濟利益,他們不能也不會引導使用者者理性建設應用系統;許多政府部門在資訊化大背景下,不管用得着還是用不着,就糊裡糊塗卷入資訊化的浪潮中;當時沒有一個針對資訊化工作進行長遠規劃,也沒有出台統一的标準,緻使各地政府部門重複投資建設的情況十分嚴重。另外,政府部門之間的條塊分割嚴重,部門壁壘森嚴重,使緻各自建立的系統之間互不相聯,從各自的部門利益出發,不但不加強資訊共享,反而加強資訊封鎖。由此形成了一個個“資訊孤島”。
從曆史發展的角度來看,“資訊孤島”出現在當時來說是電子政務的一大進步,到九十年代後期,電子政務經過十年的實作從無到有的飛躍,各政府部門基本上建立自己的資訊系統,實作了部門内部的資訊化。
第二階段 資訊傳遞
進入九十年代後計算機網絡大規模普及應用,政府部門内部實作了從單機作業到網絡化處理的轉變,是以“金”字頭為代表的多項工程取得了突破性進展。1993年,國務院資訊化工作上司小組拟定了《國家資訊化“九五”規劃和2010年遠景目标(綱要)》,國務院要求當時的電子部與有關部委大力協調,抓好幾項重大的資訊工程。從1993年起,我國開始實施金橋、金關、金卡和金稅等資訊化重大工程。金橋工程是直接為國家宏觀經濟調控和決策服務,通過建設政府的專用基礎通訊網,實作政府之間的互相連接配接。計劃建成一個連接配接全國各省市區、400多個城市,與幾十個部委互聯的專用網。金關工程主要是為提高外貿及相關領域的現代化管理和服務水準而建立的資訊網絡系統。到1999年,已實作了銀行、外彙管理機構以及海關的計算機聯網,在關稅管理中發揮了重要作用。金卡工程是推動銀行卡跨行業務的聯營工作,現已取得了重要進展。金稅工程的首期工程已經完成,主要是建立稅務系統的增值稅專用發票計算機稽核系統。
金字工程基本上實作了政府部門内部業務資料和公務資訊的傳遞,但是,由于沒有現實跨部門的資料共享,部門壁壘依然存在,資訊孤島現象并未消除。
第三階段 資料共享
1999年1月,政府上網工程主網站www.gov.cn正式開通試運作,成為我國政府上網的導航中心和服務中心。2001年,國務院辦公廳制定了全國政府系統政務資訊化建設的5年計劃,即《全國政府系統資訊化建設2001-2005年規劃綱要》。對我國政府資訊化的指導思想、方針、政策等做出明确的規定。
随着電子郵件技術和新一代辦公自動化系統在電子政務中得到了廣泛應用,政府各部門基本上實作了資料共享。通過建立目錄服務等共享資料庫,以手工錄入或導入導出等方式,将資料、文檔等存入共享庫中,作為共享資訊,實作對所需資訊的便捷檢索和查詢。共享資料庫是目前常用的共享技術,其相關應用一般建立在資料庫技術基礎之上。共享資訊一般分為結構性資料和非結構性資料。
由于共享資料庫技術沒有建立完整的、自動的資訊采集、共享體系,資訊錄入就成為一項費時費力的工作。随着資訊系統地大量增加和資訊來源的多樣化,共享資料庫中的資訊經常因為不能及時更新而失效。其次,由于共享資料庫技術要求在系統設計階段就确定資料結構,一旦資料格式或資料結構被确定下來,新增共享資訊來源和相關應用的擴充性等存在難題。
第四階段 資料交換
在電子政務網絡中,無論是橫向還是縱向的部門間,都存在着大量的資料交換需求。為完成這些資料交換任務,一般都會規劃一個統一的資料交換系統,作為其他業務系統的底層平台,提供系統内各業務部門間的資料遞送服務。為解決電子政務資料交換問題,2002年國務院資訊化辦公室選擇了北京、上海、杭州、青島四個城市進行企業基礎資料交換平台試點建設。
企業基礎資訊交換資訊系統平台,是用于實作工商行政管理部門、稅務部門及品質技術監督部門之間企業基礎資訊資源共享的業務管理和實作的平台。杭州市試點建設最為成功,系統投入使用3個月内杭州市工商部門通過該系統檢查出有23.6%的新增工商戶未辦理稅務登記,有9.8%未辦理組織機構代碼注冊登記,杭州市曆年共有稅務登記漏管戶達11718戶,各相關部門積極對不正常企業資料進行分析、處理,積極通過各種方式對漏管戶進行催登,對監管薄弱環節及時進行了整改。杭州市企業基礎資料交換平台試點建設取得了顯著的效果。國信辦[2005]10号文是在總結北京市、青島市、杭州市、深圳市四城市開展企業基礎資訊交換試點,特别是杭州市經驗的基礎上,向全國釋出企業基礎資訊交換平台系統建設的指導性檔案。
第五階段 資料中心
2004年上海、北京、武漢等資訊化程度較高的大城市開始建設資料中心或資料資源中心。經過十多年的資訊化建設,政府各部門均建造了自己的業務處理系統,儲存并不斷産生着大量的資料資訊,為了集中利用這些資料資源,一般的方式是建立統一的政府資料中心,将分散在各部門的公共資訊采集到資料中心集中管理,各資料使用部門通過通路資料中心實作資訊的共享。
1.跨業務再交換,實作異構資料的整合。由于在電子政務初期建設過程中缺乏統一的資料标準、各部門采用的資料管理技術差異也比較大,經過業務的資料交換之後,隻能實作以單一的對象為資料交換。是以,通過建立跨業務再交換系統,完全實作以将各種異構資料進行整合,是建立電子政務資料中心的基本要求。
2.建立資訊搜尋與資料資源中心。按照國務院《全國政府系統資訊化建設2001-2005年規劃綱要》的要求,各級政府必須要建立“三網一庫”體系。政府機關内部的辦公業務網;國務院辦公廳與各地區、各部門連接配接的辦公業務資源網;以網際網路為依托的政府公衆資訊網;政府系統共建共享的電子資訊資源庫。通建立基于多種管道的各種異構資料采集系統,并将采集到的資料存入資訊資源庫。為友善使用者檢索資訊,建立基于電子政應用的搜尋引擎。針對外網資料資源建立Web資訊檢索;針對内網建立基于XML的分布式搜尋引擎;針對專網建立中繼資料搜尋引擎。
3.建立資料挖掘與決策支援系統。應用資料倉庫技術,對社會重大決策産生影響的統計分析資料,利用現在的資訊資源進行深入的知識挖掘。并成為政府各種業務系統、政府部門之間協同工作的資料中心,是政府門戶的資訊中心、多媒體、文檔資料和政策法規的存儲中心和預測決策所需的資料倉庫中心。
二、業務資料交換平台
業務資料交換是實作跨政府部門間的資料交換,它以單一的業務對象資訊(如企業基礎資訊)在不同的職能部門間為交換基點,實作不同職能部門之間的業務協同和資訊共享。業務資料交換的基本架構包括了單一進制資料标準、前置交換機系統、資訊交換總線(中間件)和工作流管理四大部分組成。
(一)電子政務資料交換體系的選擇
電子政務資料交換是随着電子政務發展互聯互通的需求日益增加而産生的,政府管理本身的複雜性,決定電子政務結構的複雜性,要實作政府各部門之間進行互動式辦公和處理大量為公衆服務的事項;而每一個部門的管理業務本身又是一個相對獨立的系統,業務差别很大,要使這些不同業務部門的政府機構之間實作互通互聯,做到“一線式服務”,是一個非常複雜的問題。如何從根本上解決各部門、各系統之間的資料交換,主要有三種方式:
1.點對點互連。此種方式最為簡單,兩個系統之間各寫一個接口就可以實作資料的交換。一個地級市政府部門多達幾十個,他門之間的資料交換呈網狀交換,很明顯,以局的資訊系統即所謂資訊孤島為機關設計同其它局交換的資訊交換,其代價、技術的複雜度是相當高的。這種內建的方式是用手工程式設計,對每一個機關都要開發一個接口。如果有N個應用系統需要內建,就需要建立N(N-1)/2個接口程式。如果一個政府有100個部門,其接口程式的開發工作量是可想而知的。如果某個機關的資訊系統發生變化,則相應的接口都會要進行調整。
2.資料交換中心。各應用系統與資料交換中心相連,通過資料交換中心來實作資料共享和路由。這種連接配接方式實作了資料的無縫交換和共享通路,保證了各業務系統的有效協同,同時又能保證各應用系統的互相獨立性和低耦合性,從整體上提高了系統運作效率和安全性。如果采用資料交換中心技術,則隻需要16個接口,比點對點互連方式要優越得多。然而,是不是一個城市隻要建立一個統一的交換平台系統就能處理完這如此巨大的社會資訊資源呢?從節省投資和效益最大化的角度來看這似乎并沒有什麼錯。經過這幾年國内的實踐情況看,這個大一統在資料交換中心的模式在具體的應用中遇到了巨大的困難,為什麼有一些城市資訊共享互聯互通屢遭失敗呢?是部門壁壘?是資料形态複雜?還是技術實作有問題?這些事實一方面說明了我國電子政務的複雜程度,另一方面方面也說明了技術實作不可能一促而蹴。
3.業務資料交換。以單一的業務對象資訊(如企業基礎資訊)在不同的職能部門間為交換基點,實作不同職能部門之間的業務協同和資訊共享。業務資料交換不同于資料中心式的交換,首先它選擇關聯度高的業務實體,企業基礎資料為中心開展政府各主管部門的業務,其他與企業基礎資料無關的業務均不納入交換系統當中。其次,平台共同擁有一個唯一辨別,例如企業基礎資訊交換平台以企業組織機構代碼做唯一辨別,在面向企業服務的部門中形成了它之間與企業緊密的服務關系。事實上,電子政務資料交換将被劃分為業務資料交換和跨業務的資料交換。
業務資料交換體系結構圖
2002年10月25日,國務院資訊辦、國家工商行政管理總局、國家稅務總局、國家品質檢驗檢疫總局聯合下發了《關于開展企業基礎資訊交換試點的通知》(國信辦〔2002〕62号),選擇北京市、青島市、杭州市、深圳市四城市,開展工商、國稅、地稅和品質技術監督部門之間的企業基礎資訊交換試點。經過一年的試點,杭州市企業基礎資料交換平台系統取得了顯著的業績。2003年4月,國信辦在杭州市召開了《國家資訊化專家論壇》會議,對杭州經驗做了深入研讨和評估,主要有以幾方面因素:
1.減少系統的複雜程度。社會資訊資源一個複雜的系統,無法用一個平台進行交換,但可以拆分成多部件,使這些業務的複雜程度要低于整個系統。杭州市企業基礎資料交換平台系統僅局限于工商、國稅、地稅和品質技術監督四個部門,這就大大降低了系統建設的複雜程度。
2.選擇關聯度高的業務體。杭州市企業基礎資料交換平台系統就是緊緊圍繞着企業基礎資料開展政府各主管部門的業務,其他與企業基礎資料無關的業務均不納入交換系統當中,系統目标非常明确。
3.具有完整的業務資料功能。工商、國稅、地稅和品質技術監督均為面向企業服務的部門,其服務架構所針對的是同一種資料辨別,即企業組織機構代碼,并形成了它之間與企業緊密的服務關系。
國信辦[2005]10号文是在總結北京市、青島市、杭州市、深圳市四城市開展企業基礎資訊交換試點,特别是杭州市經驗的基礎上,向全國釋出企業基礎資訊交換平台系統建設的指導性檔案。是以,要充分了解國信辦[2005]10号文的精神,從技術架構上更多的吸取杭州市的功能經驗,按具體的服務應用架構去建構企業基礎資訊交換平台系統,盡量避免應用上的風險。
(二)業務資料交換台平總體架構
業務資料交換平台系統總體架構由交換前置機系統、資料交換總線系統、交換中心資料庫、流程管理和服務監控系統。
業務資料交換台平總體架構圖
(以企業基礎資料交換平台為例)
1.交換前置機。連接配接交換前置機與資料交換中心的網絡系統(通常為政務内網),交換前置機的作業系統、前置交換資料庫、資料交換通訊接口、資料交換橋接接口、前置交換安全管理子產品等組成。交換前置機的主要任務是由部門業務資料庫到前置交換機資料庫之間的資訊交換橋接接口,以完成兩個資訊庫之間的線上實時交換。
2.資料交換總線:通過資料标準對比,實作不同部門前置交換資訊庫之間安全、可靠、穩定、高效的資訊交換傳遞系統。資料交換總線的技術核心是資料交換中間件系統。
3.中心資料庫:是以對象的原始資料(如企業登記注冊資訊)為基礎,以中繼資料主鍵(如組織機構代碼)為唯一辨別,經線上實時交換及資訊比對後形成的中心資料庫。各部門業務資料庫與交換中心之間共享資訊雙向交換的中轉資料庫。包括部門對外釋出的資訊和從其他部門接收的資訊。
4.管理與服務系統:由資料比對、對象基礎資訊庫管理與維護、日志管理、使用者及權限管理、資料備份以及對整個交換運作情況的監控等部分組成。
(三)業務資料交換中間件系統
業務資料交換中間系統是通過內建不同應用系統之間形成松耦合連接配接,實作資訊交換、路由、分發、轉換等功能。資料交換系統主要以消息和異步通訊技術為手段,面向服務體系為架構,服務總線為基礎,XML 為資訊描述語言,實作各應用系統間的內建。
業務資料交換中間件系統結構圖
業務資料交換中間件系統由基礎服務、消息服務、消息代理服務三部分組成。内置安全和目錄管理提供安全認證、資訊加密傳輸和資源通路控制等功能。同時,提供系統管理工具,實作系統的分布式遠端管理和監控。資料交換系統的主要功能有以下5個子系統構成
1.基礎服務
基礎服務主要包括MBean 服務、SOAP 服務、Web 服務、XML 消息封裝、目錄服務和基于PKI 技術的安全認證系統。
l 基礎服務提供用于管理服務的MBean 服務,實作元件的可管理(包括遠端管理和部署)。利用Web 服務、SOAP 服務、XML 消息封裝實作基于Web 服務技術的資訊封裝、資訊交換和應用整合,以服務描述語言格式封裝業務系統,對外提供Web 服務接口。
l 基礎服務提供LDAP 或UDDI 等目錄服務,實作服務的注冊、查詢、檢索等功能。基礎服務提供符合PKI 規範的安全認證系統,實作消息摘要、身份認證和消息加密功能;同時,提供和外部安全支撐系統的接口,連接配接符合PKI 規範的外部安全支撐平台。基礎服務還提供消息隊列存儲、事務控制、雙機熱備、錯誤處理等服務,以保障基礎服務的穩定性和可靠性。
2.消息服務
消息服務将資料以“點到點(Peer to Peer)”方式或“釋出/訂閱(Pub/Sub)”方式傳送,支援基礎服務提供的HTTP、HTTPS、RMI、SMTP、SOAP 等多種傳輸協定。消息服務的主要功能是:
l 支援Web 服務和消息隊列兩種消息傳輸機制,保證平台對不同系統的适應性;資訊以XML 格式表示,資料交換和傳輸通過HTTP 等傳輸協定,資料打包采用SOAP 技術标準。
l 提供可靠的資訊傳輸,支援大規模資訊釋出、消息隊列的存儲保護、傳輸确認、斷點續傳、一次性傳輸和消息壓縮傳輸。
l 提供符合PKI 規範的安全資訊傳輸功能,支援SSL 傳輸、消息封包和消息内容加密等不同級别的安全保護措施,支援消息摘要、數字簽名、消息加密。
l 支援區域網路(LAN)和廣域網(WAN)消息通信,支援靜态和動态IP 位址。
l 基于消息軟總線的體系結構,利用智能化的資訊路由傳輸機制,動态地實作點到點、點到多點和多點到多點等不同的資訊通信方式,支援多點傳播(Multicasting)功能。
l 提供靈活友善的應用開發接口,便于二次開發;提供易于使用的部署工具,友善系統實施。
l 提供易于使用的遠端管理接口和圖形化界面,實作集中管理。
l 提供和其他消息系統之間的消息傳輸和轉換。
3.消息代理服務
消息代理服務提供消息的傳遞、轉換、過濾、映射和路由等功能。根據設定的消息格式規則和轉換規則,進行消息格式的轉換。同時,根據消息路由規則,實作消息的路由,并将消息傳遞給相應的應用系統。
4.消息轉換
消息轉換根據轉換規則,實作不同資料存儲格式和表示格式的轉換。消息轉換規則支援XSLT 語言,使用者可自定義消息傳輸格式。消息傳輸提供圖形化的轉換工具,利用圖形化界面,将一種應用資料格式“映射”到另一種資料格式,轉換工具能夠自動生成轉換規則檔案(XSLT 檔案)。轉換功能支援XML 和資料庫之間、不同資料庫之間、不同XML 之間的轉換。轉換規則檔案可以動态地部署到資料交換系統中。
5.消息路由
根據消息路由規則,消息路由服務實作消息在不同的資料交換系統之間和不同消息隊列之間的路由。消息路由支援兩種路由規則:
l 基于内容的路由根據消息的内容,消息路由按照定義的規則将特定内容的消息路由到不同的資料交換系統或消息隊列中。
l 基于消息頭的路由根據消息頭中的目的地進行消息路由。
(四)業務資料交換工作流程管理
業務流程管理系統是資訊互動與管理的中樞,是應用系統間業務流程整合和資訊縱橫傳輸的控制中心。流程管理系統基于應用內建技術和Web服務技術,獨立于具體應用之外,提供流程設計、重組、部署、管理、監控、審計、優化的環境。流程管理系統提供一系列工具以便設計、修改、監控與管理業務流程及各流程節點對應的服務。流程管理系統支援面向服務、流程驅動的體系結構,既可以将現有不同應用系統的流程協同起來,也可以将新應用系統的流程統一起來,最終将業務流程調整、管理、設定的權力從IT 技術人員手中移交給業務人員。
流程管理系統的體系結構圖
流程管理系統的核心元件包括:流程模組化、流程模拟、流程運作環境、流程倉庫、流程部署、流程管理和監控、流程審計和流程分析與優化。流程管理系統對業務系統的排程,通過應用內建系統和應用擴充卡系統實作。流程管理系統的主要功能有以下個方面:
1.流程模組化。由于一個業務流程包含若幹節點,每個節點對應一項操作,各個節點以及節點之間的互相關聯構成業務流程。通過提供流程模組化和設計工具,對業務流程規則與過程進行定義。
2.流程模拟。通過流程仿真運作環境,對設計完成的業務流程模拟運作,檢查流程定義和各個節點配置正确與否,進行流程分析,提供各個節點資源消耗情況報告等。
3.流程運作環境。流程運作環境是流程管理系統的核心部分,它為流程的運作提供虛拟機、狀态存儲、流程資料存儲、服務的排程、任務的配置設定等核心服務。流程運作環境提供基于Web 服務的外部調用接口,實作對流程定義、流程狀态、流程資料、系統管理的查詢、更改和監控。同時,還支援跨平台和Web 服務技術。
4.流程倉庫。流程倉庫提供流程定義的釋出、更改、删除和版本控制,以及相關服務的注冊、索引、查詢、更改和删除。同時,還提供外部應用服務接口的定義和調用。
5.流程部署。提供流程釋出工具,将設計好的流程釋出到流程倉庫中,供流程運作環境使用。
6.流程管理和監控。實作流程調整、系統性能監控、系統異常處理等功能。
7.流程審計。對流程執行個體的建立、資源的應用、執行的日期、執行的人員、流程的結果等進行審計。
8.流程分析與優化。提供流程的統計報表,分析流程運作中的資料(如資源的使用率、成本、時間等),對流程中影響性能的節點進行優化。同時,提供與不同分析工具的接口。
三、電子政務資料中心
電子政務資料中心歸根結底應該以服務于政府和社會為宗旨。對政府來說,應當使政府行政管理、應急指揮和快速反應的能力進一步提高,做到科學、高效的宏觀管理和決策。對社會及時釋出大量有價值的政務資訊,引導企業自主走向市場,對經濟發展和社會進步進行導向,減少盲目性。
(一)資料中心總體結構
在政府資訊資源開發和應用上,要在展現政府資訊公開和面向社會服務的原則基礎上,制定政府資訊庫建設規範、資訊資源采集、加工和釋出以及管理實施标準,關鍵是制定統一的規劃和技術标準,以此規範電子政務的可持續發展。保證政府資訊資源在政府機構内部實作暢通流轉、共享。從這個意義上說,政府資訊資源庫應當是一個“大、全、精”的政府資訊資料庫群。
電子政務資料中心結構圖
資料中心資料資源庫
資料中心的基礎是資料資源庫,它由業務資料資源資料庫、社會資源資料庫和中繼資料庫組成
業務資料庫由基礎資料庫、主題操作資料庫、辦公資料庫、公文資料庫等組成基礎資料庫包括人口資料庫、企業基礎資料庫、空間地理和自然資源資料庫、以及宏觀經濟資料庫等。主題操作資料庫,存有經常使用的業務資料,可存在資料中心,但大量的是以目錄形式存儲,而其資料總是存在各局委辦,這樣既保證了資料的動态更新的一緻性,也保證了資料的安全性。辦公資料庫,記錄政府系統辦公的資料。并聯審批,使用者使用狀态日志以及進行平台管理,電子政務系統維護管理的資料。該項資料根據相關平台工具和業務系統進行定義和維護其結構模型遵循關系資料庫的設計原則。文本資料資料庫,主要包括國家的政策和指令,本市的資料和條文等資訊。在國家政府機構,這樣的資料顯得額外重要,離開了它,就不能保證各項工作正常進行的方向。目前機關的相關資料以紙面的居多,一些比較少的在庫中存放的資料也是以掃描方式進入,因為各機關資源的共享問題,并沒有做到資料的互通,查找資料的過程可能就是一個費時費力的過程。
社會資源資料庫由互聯資訊資料庫、多媒體資料資料庫、電子商務資料庫組成。互聯資訊資料庫由網際網路資訊采集系統按一定要求自動抽取,便公衆和政府從業人員友善檢索到網際網路上的資料。多媒體資料資料庫包括各種政務圖像、視訊,用于宣傳報道和視訊點播。電子商務資料庫是企業交易過程的記錄、供求資訊和信用資訊。
中繼資料庫,建設目标是建立全市統一的政務資料字典和資料中心的中繼資料模型。該資料庫由兩部分組成:一是政務資料字典,包括政務叙詞表,資訊分類、代碼和名額體系表。主要用于各職能部門的資訊聯接與交換。二是資料中心中繼資料,具體可包括資料模型定義、資料抽取規則、映射轉換規則、主題定義、資料分類和次元定義、決策模型定義等等。
基于資料中心資源庫的服務體系
政府決策資訊,如國家和地方的政策、法規條例、決策咨詢、戰略發展研究報告(包括各職能機構和院所曆年的研究成果)和階段性的總體規劃等;
社會服務資訊,如國際國内重大政治新聞、經濟運作分析、熱點透視、社情民意動态、稅收征管、統計報表、市場供求資訊、社會與經濟預測資訊、金融财經資訊、科技與人才資訊,等等;
政府交流資訊,政府部門之間因工作職能的需要交換資訊,如各種公文、會議情況、總結報告、記錄資料、辦公文檔、機關行政管理資訊、經驗介紹、駐外辦事處等工作流資訊。
應對事件預案,整個城市的各類資源要素儲備和分布狀況,行政組織及人力資源調配預案,對自然災害和意外事故的處理,重大突發事件的應急預案。
城市地理資訊,如城市地理狀況、地下網、管、道和線的分布結構,以及城市規劃與發展的思想庫以及城市發展和政府行政的曆史沿革等資訊。
(二)業務資料整理系統
業務資料整理系統是資料中心的一個重要組成部分,是資料中心的門戶,它實作不同業務資料平台之間的資料交換、共享和業務流程的對接,實作異構資料整合。
業務資料整理系統結構圖
提供對各種資料庫系統的通路能力,以實作異構資料庫的互聯。
提供不同資料格式間的自動轉換能力,以保證各種格式的資料均能夠按政府資料中心的規範格式存入資料庫系統。
提供資料的過濾、填充功能,以實作抽取來源于各種系統的資料内容能夠滿足資料中心的要求。
提供資料庫同步機制,以實作将各業務資料交換平台的中心資料庫中的資料自動同步到資料中心的資料庫中。
(三)資訊資源搜尋引擎
網絡檢索最常用的檢索工具就是搜尋引擎。所謂搜尋引擎(SearchEngine)實際上是專用的WWW伺服器,它利用自動搜尋軟體(如robot,spider,harvest,persuit等)沿着WWW超鍊,搜尋整個WWW上的首頁,然後為這些首頁的每個文字建立索引并送回集中管理的索引資料庫。索引資訊包括WWW位址,每個文檔中單字出現的頻率、位置等。搜尋引擎大多采用集中抓取資訊,它們努力周遊整個網際網路,對周遊的文檔生成全文索引,供使用者檢索。
網際網路搜尋引擎的基本結構圖
基于網際網路的搜尋引擎,大多采用的是集中式抓取的方式,努力周遊整個網際網路,對周遊的文檔生成全文索引,供使用者檢索。然而,任何一個搜尋引擎都不能覆寫全部網際網路,據不完全統計,目前最好的搜尋引擎也隻能查詢約三分之一的Web頁面。如想獲得一個比較全面、準确的結果,就必須反複運用多種搜尋引擎,這無疑增加了使用者的負擔。元搜尋引擎的出現,在一定程度上解決了這個問題。
元搜尋引擎(MetasearchEngine)是建立在搜尋引擎之上的搜尋引擎。使用者隻需遞交一次檢索請求,由元搜尋引擎負責轉換處理後送出給多個預先標明的獨立搜尋引擎,并将所有的查詢結果集中起來以整體統一的格式呈現在使用者面前。元搜尋引擎采用了一系列的優化運作機制,能夠在盡可能短的時間裡提供相對全面、準确的資訊。
一般地,元搜尋引擎包括:檢索請求送出機制、檢索接口代理機制和檢索結果顯示機制。“請示送出”負責實作使用者個性化的檢索設定要求,包括調用的搜尋引擎、檢索時間的限制、結果數量的限制等。“接口代理”負責将使用者的檢索請求“翻譯”成滿足不同搜尋引擎的“本地化”要求格式。“結果顯示”負責所有元搜尋引擎檢索結果的去重、合并以及輸出格式處理等。從檢索機制角度來看,元搜尋引擎是一種分布式資訊檢索系統。由于其檢索覆寫面廣,系統相對簡單,因而發展迅速。
-
基于中繼資料XML的分布式資訊檢索過程圖
(四)資料倉庫與決策支援
資料倉庫(Data Warehouse,DW)是指來自于異地、異構的資料源和各種資料庫的資料經加工後在一種稱之為資料倉庫的存儲地存儲、提取和維護。資料倉庫既是一種結構和富有哲理的方法,也是一種技術。資料和資訊從不同的資料源提取出來,然後把這些資料轉換成公共的資料模型,便于使用者的決策查詢。
資料倉庫體系結構
資料源:是資料倉庫系統的基礎,是整個系統的資料源泉。通常包括政府部門内部資訊和外部資訊。内部資訊包括存放于各部門操作型資料庫中的各種電子政務資料和辦公自動化(OA)系統包含的各類文檔資料。外部資訊包括各類法律法規、社會資訊以及各類外部統計資料及各類文檔等。
資料的存儲與管理:是整個資料倉庫系統的核心。在現有各業務系統的基礎上,對資料進行抽取、清理,并有效內建,按照主題進行重新組織,最終确定資料倉庫的實體存儲結構,同時組織存儲資料倉庫中繼資料。按照資料的覆寫範圍,資料倉庫存儲可以分為資料中心級資料倉庫和部門級資料倉庫(通常稱為“資料集市”,Data Mart)。資料倉庫的管理包括資料的安全、歸檔、備份、維護、恢複等工作。
OLAP伺服器:對分析需要的資料按照多元資料模型進行再次重組,以支援使用者多角度、多層次的分析,發現資料趨勢。
前端工具與應用:前端工具主要包括各種資料分析工具、報表工具、查詢工具、資料挖掘工具以及各種基于資料倉庫或資料集市開發的應用。其中資料分析工具主要針對OLAP伺服器,報表工具、資料挖掘工具既針對資料倉庫,同時也針對OLAP伺服器。
|
決策支援系統
決策支援系統和資料倉庫執行的都是決策和趨勢分析類的應用。決策支援系統中的一些技術可以很好地內建到資料倉庫中,使資料倉庫的分析能力更加強大。例如:決策支援系統中的傳統統計分析模型可以幫助使用者對資料倉庫中的資料進行更加有效、更加深入的分析,進而更好地掌握和利用資訊。
資料挖掘是資料倉庫應用中比較重要且相對獨立的部分,它可以從資料倉庫的海量資料中提取出人們感興趣的知識,這些知識是隐含的、事先未知的潛在有用資訊。提取的知識以概念、規則、規律、模式等形式提供給使用者。
資料倉庫是面向決策分析的,具有從各種資料源抽取資料,并對資料進行清洗、聚集和轉換等各種處理能力。從這個意義上說,資料倉庫既是一個資訊資源的存儲機制,也是一個資訊資源分析、處理的支援決策的系統。政府組織的決策行為依賴于資訊資源的良好組織,因而基于資料倉庫的政府資訊資源存儲必然成為主流的政府資訊資源存儲方式。
參考文獻
1.《全國企業基礎資訊共享實施要求》國信辦[2005]10号文附件
2.《電子政務資訊共享互聯互通平台總體架構技術指南》國辦秘函[2004]79号文附件
3.《關于開展企業基礎資訊交換試點方案》國信辦[2002] 62号文附件
4.《企業基礎資訊交換試點方案》國信辦[2003] 47号文附件
5.《國務院辦公廳關于建設全國政府行政首腦機關辦公決策服務系統的通知》(國辦[1992]25号檔案)
6.《可視化資料挖掘》[美]Tom Soukup著 電子工業出版社 2004年版
7.《資料挖掘原理與算法》邵峰晶 于忠清 編著 中國水利水電出版社 2003年版
8.《電子政務技術》蘇新甯 吳鵬 朱曉峰 闵東 編著 國防工業出版社 2003年版
9.《政府資訊資源開發與管理》李緒蓉 徐煥良 編著 北京大學出版社 2005年版
10.《電子政務技術導論》陸敬筠 邵錫軍 編著北京大學出版社 2005年版
轉自 http://www.reformsoft.com/show.php?contentid=69
