天天看點

好程式員大資料教育訓練分享《MySQL資料庫》資料庫相關概念及曆史發展

  好程式員大資料教育訓練分享《MySQL資料庫》資料庫相關概念及曆史發展

  一、資料存儲的曆史發展自從人類開啟靈智以來,就學會了記錄資料,比如遠古人用石頭在牆壁上畫道道用來統計打回來的獵物數量,後來出現了甲骨文用來記錄人類的文明發展,再如我們知道的古代人使用竹子,布等充當記錄文字的工具。造紙術的發明,大大提高了人類文明的進步,使我們在資料記錄和文明傳播上更為友善快捷,近代計算機的發明,讓我們的世界文明有了質的飛躍,開始進入科技時代。在資料存儲上,資料庫軟體的出現,讓我們少了很多在管理資料上的負擔。

從資料管理的角度看,資料庫技術到目前共經曆了手工管理、檔案系統和資料庫系統三個階段。

1、手工管理階段

是指計算機誕生的初期(即20世紀50年代後期之前),這個時期的計算機主要用于科學計算。從硬體看,沒有磁盤等直接存取的儲存設備;從軟體看,沒有作業系統和管理資料的軟體,資料處理方式是批處理。具有以下特點

(1)資料不儲存。隻用于科學計算,如在計算某一課題時,将資料輸入,用完後不儲存原始資料,也不儲存計算結果。

(2)沒有軟體系統對資料進行統一管理。資料的邏輯結構,包括存儲結構,存取方式和輸入輸出方式會随着資料的變化而 變化,資料與程式不具備一緻性,無法統一管理。

(3)資料不共享。資料是面向應用的,即使兩個應用用到相同的資料,也必須各自定義,組織,資料無法共享。

(4)資料不具有獨立性。資料與應用密切相關,應用改變,資料也會跟着變化,是以沒有獨立性。

2、檔案管理

是指計算機不僅用于科學計算,而且還大量用于管理資料的階段(從50年代後期到60年代中期)。在硬體方面,外存儲器有了磁盤、磁鼓等儲存設備。在軟體方面,作業系統中已經有了專門用于管理資料的軟體,稱為檔案系統。可以總結出以下特點

(1)資料以檔案的形式可以長期儲存。由于檔案概念的引用,資料可以長期保留,是以可以經常對檔案進行查詢、修改、插 入和删除等反複操作。

(2)由檔案系統管理資料。作業系統提供了檔案管理系統和通路檔案的存取方法,程式和資料之間有了資料存取的接口,程 序可以通過檔案名和資料打交道,不必再尋找資料的實體存放位置。

(3)檔案形式多樣化。檔案形式如由順序檔案,索引檔案、連結清單檔案等。

(4)資料存取以記錄為機關。

盡管檔案系統有上述優點,但是,檔案系統仍存在缺點,如

(1)資料共享性差,備援度大

(2)資料獨立性差

3、資料庫管理

從60年代後期開始,進入資料庫管理階段。在這一階段中,資料庫中的資料不再是面向某個應用或某個程式,而是面向整個企業(組織)或整個應用的。資料庫系統階段的特點如下

(1)面向資料模型化。這個時期,資料庫系統不僅可以描述資料本身,還可以描述資料之間的複雜關系。

(2)較高的資料獨立性。資料和程式彼此獨立,資料存儲結構的變化,盡量不影響使用者的使用。

(3)備援度低。資料庫系統中的重複資料被減少到最低程度,這樣,在有限的存儲空間内可以存放更多的資料并減少存取時 間。

(4)資料由DBMS統一管理和控制。資料庫系統具有資料的安全性,以防止資料的丢失和被非法使用;具有資料的完整性, 以保護資料的正确、有效和相容;具有資料的并發控制,避免并發程式之間的互相幹擾;具有資料的恢複功能,在資料 庫被破壞或資料不可靠時,系統有能力把資料庫恢複到最近某個時刻的正确狀态

二、資料庫的相關概念

1、資料庫

英文名Database,簡稱DB。是按照某一特定的資料結構來組織、存儲和管理資料的倉庫。

2、資料庫管理系統

英文名Database Management System,簡稱DBMS。是一種操縱和管理資料庫的大型軟體,用于建立、使用和維護資料庫。它對資料庫進行統一的管理和控制,以保證資料庫的安全性和完整性。它介于使用者和資料庫之間。使用者通過DBMS來通路資料庫中的資料。

好程式員大資料教育訓練分享《MySQL資料庫》資料庫相關概念及曆史發展

三、表的概念

1、資料表(table),是關系型資料庫的基本存儲結構。一個關系型資料庫是由多個表組成的。

2、資料表是二維的,它由縱向的列和橫向的行組成。

3、資料表的行(Row)是橫排資料,也被稱之為記錄(Recond)。

4、資料表的列(Column)是豎排資料,也被稱之為字段(Field)。

5、表與表之間也可能存在着關系。

例如一個有關學生資訊的名為 students 的表中,每個列包含的是所有學生的某個特定類型的資訊,比如“姓名”,而每行則包含了某個特定學生的所有資訊:姓名、學号、專業,院校等等。

對于資料表來說,列的數目一般事先固定,各列之間可以由列名來識别;而行的數目可以随着時間,動态變化。每行通常都可以根據某個或某幾個列中的資料來識别。

四、關系型資料庫

首先,我們需要了解一個名詞“關系模型”的概念。所謂關系模型,就是指二維表格結構,即表的行與列的關系。比如設計教師資訊的關系模型,就是一條記錄表示一個教師的資訊,而這條記錄中每個字段表示這個教師的特定資訊。教師(教師編号,姓名,年齡,性别,科目)。

關系型資料庫,是建立在關系模型基礎上的資料庫,借助于集合代數等數學概念和方法來處理資料庫中的資料;一個關系型資料庫是由二維表及其之間的聯系組成的一個資料組織。現實世界中的各種實體以及實體之間的各種聯系,我們均可以使用關系模型來表示。

目前主流的關系型資料庫有Oracle、DB2、Sybase、Microsoft SQL Server、Microsoft Access、MySQL等。

Oracle資料庫,是著名的Oracle(甲骨文)公司旗下的資料庫産品,是世界上第一個商品化的關系型資料庫管理系統,采用标準SQL,支援多種資料類型,提供面向對象的資料支援,支援unix,windows,os/2等多種平台。目前最新版本oracle 12.2c。

DB2,是IBM公司的關系型資料庫管理系統。有很多不同的版本,可以運作在從掌上産品到大型機不同的終端及其上。是oracle的主要競争對手。

Sybase,是Sybase公司的資料庫産品,2010年被SAP收購。

SQL Server,是微軟旗下的産品,運作在windows NT伺服器上。現在的應用領域越來越大。

Microsoft Office Access,是由微軟釋出的關系資料庫管理系統。它結合了 MicrosoftJet Database Engine 和 圖形使用者界面兩項特點,是 Microsoft Office 的系統程式之一。

MySQL,是開放源碼的小型資料庫管理系統,最開始是瑞典的MySQLAB公司的産品,後來被Sun公司收購,在2009年4月20号Sun公司被Oracle收購。