天天看點

什麼是資料庫?5分鐘深入了解資料庫原理

作者:網絡安全小白入門

1.什麼是資料庫呢?

你正在讀本 SQL 教程,這表明你需要以某種方式與資料庫打交道。SQL 正是用來實作這一任務的語言,是以在學習 SQL 之前,你應該對資料庫以及資料庫技術的某些基本概念有所了解。

你可能還沒有意識到,其實自己一直在使用資料庫。每當你在手機上選取聯系人,或從電子郵件位址簿裡查找名字時,就是在使用資料庫。你在網站上進行搜尋,也是在使用資料庫。你在工作中登入網絡,也需要依靠資料庫驗證使用者名和密碼。即使是在自動取款機上也能使用 ATM 卡,也要利用資料庫進行密碼驗證和餘額查詢。

雖然我們一直都在使用資料庫,但對究竟什麼是資料庫并不十厘清楚。更何況人們可能會使用同一個資料庫術語表示不同的事物,進一步加劇了這種混亂。是以,我們首先給出一些最重要的資料庫術語,并加以說明。

提示:基本概念回顧

後面是一些基本資料庫概念的簡要介紹。如果你已經具有一定的資料庫經驗,可以借此複習鞏固一下;如果你剛開始接觸資料庫,可以由此了解必需的基本知識。了解資料庫的概念是掌握 SQL 的重要前提,如果有必要,你或許還應該找本好書好好補一補資料庫基礎知識。

一、資料庫

每個人家裡都會有冰箱,冰箱是用來幹什麼的?冰箱是用來存放食物的地方。

同樣的,資料庫是存放資料的地方。正是因為有了資料庫後,我們才可以直接查找資料。例如你每天使用餘額寶檢視自己的賬戶收益,就是從資料庫讀取資料後給你的。

資料庫(database)

儲存有組織的資料的容器(通常是一個檔案或一組檔案)。

注意:誤用會導緻混淆

人們通常用資料庫這個術語來代表他們使用的資料庫軟體,這是不正确的,也是以産生了許多混淆。确切地說,資料庫軟體應稱為資料庫管理系統(DBMS)。資料庫是通過 DBMS 建立和操縱的容器,而具體它究竟是什麼,形式如何,各種資料庫都不一樣。

二、表

你往檔案櫃裡放資料時,并不是随便将它們扔進某個抽屜就完事了的,而是在檔案櫃中建立檔案,然後将相關的資料放入特定的檔案中。

在資料庫領域中,這種檔案稱為表。表是一種結構化的檔案,可用來存儲某種特定類型的資料。表可以儲存顧客清單、産品目錄,或者其他資訊清單。

表(table)

某種特定類型資料的結構化清單。

這裡的關鍵一點在于,存儲在表中的資料是同一種類型的資料或清單。決不應該将顧客的清單與訂單的清單存儲在同一個資料庫表中,否則以後的檢索和通路會很困難。應該建立兩個表,每個清單一個表。

資料庫中的每個表都有一個名字來辨別自己。這個名字是唯一的,即資料庫中沒有與其他表具有相同的名字。

說明:表名

使表名成為唯一的,實際上是資料庫名和表名等的組合。有的資料庫還使用資料庫擁有者的名字作為唯一名的一部分。也就是說,雖然在一個資料庫中不能兩次使用相同的表名,但在不同的資料庫中完全可以使用相同的表名。

表具有一些特性,這些特性定義了資料在表中如何存儲,包括存儲什麼樣的資料,資料如何分解,各部分資訊如何命名等資訊。描述表的這組資訊就是所謂的模式(schema),模式可以用來描述資料庫中特定的表,也可以用來描述整個資料庫(和其中表的關系)。

模式

關于資料庫和表的布局及特性的資訊。

三、列和資料類型

表由列組成。列存儲表中某部分的資訊。

列(column)

表中的一個字段。所有表都是由一個或多個列組成的。

了解列的最好辦法是将資料庫表想象為一個網格,就像個電子表格那樣。網格中每一列存儲着某種特定的資訊。例如,在顧客表中,一列存儲顧客編号,另一列存儲顧客姓名,而位址、城市、州以及郵政編碼全都存儲在各自的列中。

提示:資料分解

正确地将資料分解為多個列極為重要。例如,城市、州、郵政編碼應該總是彼此獨立的列。通過分解這些資料,才有可能利用特定的列對資料進行分類和過濾(如找出特定州或特定城市的所有顧客)。如果城市和州組合在一個列中,則按州進行分類或過濾就會很困難。

你可以根據自己的具體需求來決定把資料分解到何種程度。例如,一般可以把門牌号和街道名一起存儲在位址裡。這沒有問題,除非你哪天想用街道名來排序,這時,最好将門牌号和街道名分開。

資料庫中每個列都有相應的資料類型。資料類型(datatype)定義了列可以存儲哪些資料種類。例如,如果列中存儲的是數字(或許是訂單中的物品數),則相應的資料類型應該為數值類型。如果列中存儲的是日期、文本、注釋、金額等,則應該規定好恰當的資料類型。

沒有網絡安全,就沒有國家安全

① 200多本網絡安全系列電子書

② 網絡安全标準題庫資料

③ 項目源碼

④ 網絡安全基礎入門、Linux、web安全、攻防視訊

⑤ 網絡安全學習路線

免費領取私信”安全“

資料類型

允許什麼類型的資料。每個表列都有相應的資料類型,它限制(或允許)該列中存儲的資料。

資料類型限定了可存儲在列中的資料種類(例如,防止在數值字段中錄入字元值)。資料類型還能幫助正确地分類資料,并在優化磁盤使用方面起重要的作用。是以,在建立表時必須特别關注所用的資料類型。

注意:資料類型相容

資料類型及其名稱是 SQL 不相容的一個主要原因。雖然大多數基本資料類型得到了一緻的支援,但許多進階的資料類型卻沒有。更糟的是,偶然會有相同的資料類型在不同的 DBMS 中具有不同的名稱。對此使用者毫無辦法,重要的是在建立表結構時要記住這些差異。

四、行

表中的資料是按行存儲的,所儲存的每個記錄存儲在自己的行内。如果将表想象為網格,網格中垂直的列為表列,水準行為表行。

例如,顧客表可以每行存儲一個顧客。表中的行編号為記錄的編号。

行(row)

表中的一個記錄。

說明:是記錄還是行?

你可能聽到使用者在提到行時稱其為資料庫記錄(record)。這兩個術語多半是可以互通的,但從技術上說,行才是正确的術語。

五、主鍵

表中每一行都應該有一列(或幾列)可以唯一辨別自己。顧客表可以使用顧客編号,而訂單表可以使用訂單 ID。雇員表可以使用雇員 ID。書目表則可以使用國際标準書号 ISBN。

主鍵(primary key)

一列(或幾列),其值能夠唯一辨別表中每一行。

唯一辨別表中每行的這個列(或這幾列)稱為主鍵。主鍵用來表示一個特定的行。沒有主鍵,更新或删除表中特定行就極為困難,因為你不能保證操作隻涉及相關的行,沒有傷及無辜。

提示:應該總是定義主鍵

雖然并不總是需要主鍵,但多數資料庫設計者都會保證他們建立的每個表具有一個主鍵,以便于以後的資料操作和管理。

表中的任何列都可以作為主鍵,隻要它滿足以下條件:

  • 任意兩行都不具有相同的主鍵值;
  • 每一行都必須具有一個主鍵值(主鍵列不允許空值 NULL);
  • 主鍵列中的值不允許修改或更新;
  • 主鍵值不能重用(如果某行從表中删除,它的主鍵不能賦給以後的新行)。

主鍵通常定義在表的一列上,但并不是必須這麼做,也可以一起使用多個列作為主鍵。在使用多列作為主鍵時,上述條件必須應用到所有列,所有列值的組合必須是唯一的(但其中單個列的值可以不唯一)。