天天看點

資料庫技術的曆史和發展

  資料庫技術是本世紀60年代開始興起的一門資訊管理自動化的新興學科,是計算機科學中的一個重要分支。随着計算機應用的不斷發展,在計算機應用領域中,資料處理越來越占主導地位,資料庫技術的應用也越來越廣泛。

資料庫是資料管理的産物。資料管理是資料庫的核心任務,内容包括對資料的分類、組織、編碼、儲存、檢索和維護。随着計算機硬體和軟體的發展,資料庫技術也不斷地發展。從資料管理的角度看,資料庫技術到目前共經曆了人工管理階段、檔案系統階段和資料庫系統階段。

A.人工管理階段

人工管理階段是指計算機誕生的初期(即20世紀50年代後期之前),這個時期的計算機主要用于科學計算。從硬體看,沒有磁盤等直接存取的儲存設備;從軟體看,沒有作業系統和管理資料的軟體,資料處理方式是批處理。

這個時期資料管理的特點是:

1. 資料不儲存

該時期的計算機主要應用于科學計算,一般不需要将資料長期儲存,隻是在計算某一課題 時将資料輸入,用完後不儲存原始資料,也不儲存計算結果。

2. 沒有對資料進行管理的軟體系統

程式員不僅要規定資料的邏輯結構,而且還要在程式中設計實體結構,包括存儲結構、存取方法、輸入輸出方式等。是以程式中存取資料的子程式随着存儲的改變而改變,資料與程式不具有一緻性。

3. 沒有檔案的概念

資料的組織方式必須由程式員自行設計。

4. 一組資料對應于一個程式,資料是面向應用的

即使兩個程式用到相同的資料,也必須各自定義、各自組織,資料無法共享、無法互相利用和互相參照,進而導緻程式和程式之間有大量重複的資料。

B.檔案系統階段

檔案系統階段是指計算機不僅用于科學計算,而且還大量用于管理資料的階段(從50年代後期到60年代中期)。在硬體方面,外存儲器有了磁盤、磁鼓等直接存取的儲存設備。在軟體方面,作業系統中已經有了專門用于管理資料的軟體,稱為檔案系統。

1. 資料需要長期儲存在外存上供反複使用

由于計算機大量用于資料處理,經常對檔案進行查詢、修改、插入和删除等操作,是以資料需要長期保留,以便于反複操作。

2. 程式之間有了一定的獨立性

作業系統提供了檔案管理功能和通路檔案的存取方法,程式和資料之間有了資料存取的接口,程式可以通過檔案名和資料打交道,不必再尋找資料的實體存放位置,至此,資料有了實體結構和邏輯結構的差別,但此時程式和資料之間的獨立性尚還不充分。

3. 檔案的形式已經多樣化

由于已經有了直接存取的儲存設備,檔案也就不再局限于順序檔案,還有了索引檔案、連結清單檔案等,因而,對檔案的通路可以是順序通路,也可以是直接通路。

4. 資料的存取基本上以記錄為機關

C.資料庫系統階段

資料庫系統階段是從60年代後期開始的。在這一階段中,資料庫中的資料不再是面向某個應用或某個程式,而是面向整個企業(組織)或整個應用的。資料庫系統階段的特點是:

1. 采用複雜的結構化的資料模型

資料庫系統不僅要描述資料本身,還要描述資料之間的聯系。這種聯系是通過存取路徑來實作的。

2. 較高的資料獨立性

資料和程式彼此獨立,資料存儲結構的變化盡量不影響使用者程式的使用。

3. 最低的備援度

資料庫系統中的重複資料被減少到最低程度,這樣,在有限的存儲空間内可以存放更多的資料并減少存取時間。

4. 資料控制功能

資料庫系統具有資料的安全性,以防止資料的丢失和被非法使用;具有資料的完整性,以保護資料的正确、有效和相容;具有資料的并發控制,避免并發程式之間的互相幹擾;具有資料的恢複功能,在資料庫被破壞或資料不可靠時,系統有能力把資料庫恢複到最近某個時刻的正确狀态。

二、三代資料庫系統的發展

資料模型是資料庫系統的核心。按照資料模型發展的主線,資料庫技術的形成過程和發展可從

以下三個方面反映:

A. 第一代資料庫系統 層次和網狀資料庫管理系統

層次和網狀資料庫的代表産品是IBM公司在1969年研制出的層次模型資料庫管理系統。層次資料庫是資料庫系統的先驅,而網狀資料庫則是資料庫概念、方法、技術的奠基。

B. 第二代資料庫系統 關系資料庫管理系統(RDBMS)

1970年,IBM公司的研究員E.F.Codd在題為《大型共享資料庫資料的關系模型》的論文中提出了資料庫的關系模型,為關系資料庫技術奠定了理論基礎。到了80年代,幾乎所有新開發的資料庫系統都是關系型的。真正使得關系資料庫技術實用化的關鍵人物是James Gray。Gray在解決如何保障資料的完整性、安全性、并發性以及資料庫的故障恢複能力等重大技術問題方面發揮了關鍵作用。關系資料庫系統的出現,促進了資料庫的小型化和普及化,使得在微型機上配置資料庫系統成為可能。

C. 新一代資料庫技術的研究和發展

目前已從多方面發展了現行的資料庫系統技術。我們可以從資料模型、新技術内容、應用領域三個方面概括新一代資料庫系統的發展。

(1) 面向對象的方法和技術對資料庫發展的影響最為深遠

80年代,面向對象的方法和技術的出現,對計算機各個領域,包括程式設計語言、軟體工程、資訊系統設計以及計算機硬體裝置等都産生了深遠的影響,也給面臨新挑戰的資料庫技術帶來了新的機遇和希望。資料庫研究人員借鑒和吸收了面向對象的方法和技術,提出了面向對象的資料庫模型(簡稱對象模型)。目前有許多研究是建立在資料庫已有的成果和技術上的,針對不同的應用,對傳統的DBMS,主要是RDBMS進行不同層次上的擴充,例如建立對象關系(OR)模型和建立對象關系資料庫(ORDB)。

(2) 資料庫技術與多學科技術的有機結合

資料庫技術與多學科技術的有機結合是目前資料庫發展的重要特征。計算機領域中其他新興技術的發展對資料庫技術産生了重大影響。傳統的資料庫技術和其他計算機技術的結合、互相滲透,使資料庫中新的技術内容層出不窮。資料庫的許多概念、技術内容、應用領域,甚至某些原理都有了重大的發展和變化。建立和實作了一系列新型的資料庫,如分布式資料庫、并行資料庫、演繹資料庫、知識庫、多媒體庫、移動資料庫等,它們共同構成了資料庫大家族。

(3) 面向專門應用領域的資料庫技術的研究

為了适應資料庫應用多元化的要求,在傳統資料庫基礎上,結合各個專門應用領域的特點,研究适合該應用領域的資料庫技術,如工程資料庫、統計資料庫、科學資料庫、空間資料庫、地理資料庫、Web資料庫等,這是目前資料庫技術發展的又一重要特征。同時,資料庫系統結構也由主機/終端的集中式結構發展到網絡環境的分布式結構,随後又發展成兩層、三層或多層客戶/伺服器結構以及Internet環境下的浏覽器/伺服器和移動環境下的動态結構。多種資料庫結構滿足了不同應用的需求,适應了不同的應用環境。