天天看點

了解inode

  inode是Linux作業系統中的一種資料結構,它包含了與檔案系統中各個檔案相關的一些重要資訊。在Linux中建立檔案系統時,同時将會建立大量的 inode 。通常,檔案系統磁盤空間中大約百分之一空間配置設定給了inode表。

  在展開inode前,我們先簡單看下虛拟檔案系統(Virtual File System, VFS)。

虛拟檔案系統(VFS)

  <code>Linux 有着極其豐富的檔案系統,大體上可分如下幾類:</code>

<code>網絡檔案系統,如 nfs、cifs 等;</code>

<code>磁盤檔案系統,如 ext4、ext3 等;</code>

<code>特殊檔案系統,如 proc、sysfs、ramfs、tmpfs 等。</code>

<code>  實作以上這些檔案系統并在 Linux 下共存的基礎就是 Linux VFS(Virtual File System 又稱 Virtual Filesystem Switch),即虛拟檔案系統。VFS 作為一個通用的檔案系統,抽象了檔案系統的四個基本概念:檔案、目錄項 (dentry)、索引節點 (inode) 及挂載點,其在核心中為使用者空間層的檔案系統提供了相關的接口(見下圖1所示 VFS 在 Linux 系統的架構)。VFS 實作了 open()、read() 等系統調并使得 cp 等使用者空間程式可跨檔案系統。VFS 真正實作了上述内容中:在 Linux 中除程序之外一切皆是檔案。</code>

  

  圖1. VFS在系統中的架構

  圖1更詳細的如下圖所示:

 

inode

  了解inode,要從檔案儲存說起。

  檔案儲存在硬碟上,硬碟的最小存儲機關叫做"扇區"(Sector)。每個扇區儲存512位元組(相當于0.5KB)。

  作業系統讀取硬碟的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是檔案存取的最小機關。"塊"的大小,最常見的是4KB,即連續八個 sector 組成一個 block。

  檔案資料都儲存在"塊"中,那麼很顯然,我們還必須找到一個地方儲存檔案的元資訊,比如檔案的建立者、檔案的建立日期、檔案的大小等等。這種儲存檔案元資訊的區域就叫做inode,中文譯名為"索引節點"。

  每一個檔案都有對應的inode,裡面包含了與該檔案有關的一些資訊。

  在 Linux 中,索引節點結構存在于系統記憶體及磁盤,其可區分成 VFS inode 與實際檔案系統的 inode。VFS inode 作為實際檔案系統中 inode 的抽象,定義了結構體 inode 與其相關的操作 inode_operations(見核心源碼 include/linux/fs.h)。

  inode包含檔案的元資訊,具體來說有以下内容:

  其中inode(index node,索引節點)是用于存儲檔案的中繼資料的一個資料結構。檔案的中繼資料,也就是檔案的相關資訊,和檔案本身是兩個不同 的概念。它包含的是諸如檔案的大小、擁有者、建立時間、磁盤位置等和檔案相關的資訊。

  可以用stat指令,檢視某個檔案的inode資訊:

  總之,除了檔案名以外的所有檔案資訊,都存在inode之中。至于為什麼沒有檔案名,下文會有詳細解釋。

  inode也會消耗硬碟空間,是以硬碟格式化的時候,作業系統自動将硬碟分成兩個區域。一個是資料區,存放檔案資料;另一個是inode區(inode table),存放inode所包含的資訊。

  每個inode節點的大小,一般是128位元組或256位元組。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設定一個inode。假定在一塊1GB的硬碟中,每個inode節點的大小為128位元組,每1KB就設定一個inode,那麼inode table的大小就會達到128MB,占整塊硬碟的12.8%。

  檢視每個硬碟分區的inode總數和已經使用的數量,可以使用df指令。

  檢視每個inode節點的大小,可以用如下指令:

  由于每個檔案都必須有一個inode,是以有可能發生inode已經用光,但是硬碟還未存滿的情況。這時,就無法在硬碟上建立新檔案。

  每個inode都有一個号碼,作業系統用inode号碼來識别不同的檔案。

  這裡值得重複一遍,Unix/Linux系統内部不使用檔案名,而使用inode号碼來識别檔案。對于系統來說,檔案名隻是inode号碼便于識别的别稱或者綽号。

  表面上,使用者通過檔案名,打開檔案。實際上,系統内部這個過程分成三步:首先,系統找到這個檔案名對應的inode号碼;其次,通過inode号碼,擷取inode資訊;最後,根據inode資訊,找到檔案資料所在的block,讀出資料。如下圖:

  圖檔連結

  使用ls -i指令,可以看到檔案名對應的inode号碼:

  Unix/Linux系統中,目錄(directory)也是一種檔案。打開目錄,實際上就是打開目錄檔案。

  目錄檔案的結構非常簡單,就是一系列目錄項(dirent)的清單。每個目錄項,由兩部分組成:所包含檔案的檔案名,以及該檔案名對應的inode号碼。

  ls指令隻列出目錄檔案中的所有檔案名:

  ls -i指令列出整個目錄檔案,即檔案名和inode号碼:

  如果要檢視檔案的詳細資訊,就必須根據inode号碼,通路inode節點,讀取資訊。ls -l指令列出檔案的詳細資訊。

  了解了上面這些知識,就能了解目錄的權限。目錄檔案的讀權限(r)和寫權限(w),都是針對目錄檔案本身。由于目錄檔案内隻有檔案名和inode号碼,是以如果隻有讀權限,隻能擷取檔案名,無法擷取其他資訊,因為其他資訊都儲存在inode節點中,而讀取inode節點内的資訊需要目錄檔案的執行權限(x)。

  一般情況下,檔案名和inode号碼是"一一對應"關系,每個inode号碼對應一個檔案名。但是,Unix/Linux系統允許,多個檔案名指向同一個inode号碼。

  這意味着,可以用不同的檔案名通路同樣的内容;對檔案内容進行修改,會影響到所有檔案名;但是,删除一個檔案名,不影響另一個檔案名的通路。這種情況就被稱為"硬連結"(hard link)。這種情況下,硬連結相當于檔案的别名。

  ln指令可以建立硬連結:

  運作上面這條指令以後,源檔案與目标檔案的inode号碼相同,都指向同一個inode。inode資訊中有一項叫做"連結數",記錄指向該inode的檔案名總數,這時就會增加1。

  反過來,删除一個檔案名,就會使得inode節點中的"連結數"減1。當這個值減到0,表明沒有檔案名指向這個inode,系統就會回收這個inode号碼,以及其所對應block區域。

  這裡順便說一下目錄檔案的"連結數"。建立目錄時,預設會生成兩個目錄項:"."和".."。前者的inode号碼就是目前目錄的inode号碼,等同于目前目錄的"硬連結";後者的inode号碼就是目前目錄的父目錄的inode号碼,等同于父目錄的"硬連結"。是以,任何一個目錄的"硬連結"總數,總是等于2加上它的子目錄總數(含隐藏目錄)。

  除了硬連結以外,還有一種特殊情況。

  檔案A和檔案B的inode号碼雖然不一樣,但是檔案A的内容是檔案B的路徑。讀取檔案A時,系統會自動将通路者導向檔案B。是以,無論打開哪一個檔案,最終讀取的都是檔案B。這時,檔案A就稱為檔案B的"軟連結"(soft link)或者"符号連結(symbolic link)。這種情況下,檔案A相當于檔案B的快捷方式。

  這意味着,檔案A依賴于檔案B而存在,如果删除了檔案B,打開檔案A就會報錯:"No such file or directory"。這是軟連結與硬連結最大的不同:檔案A指向檔案B的檔案名,而不是檔案B的inode号碼,檔案B的inode"連結數"不會是以發生變化。

  ln -s指令可以建立軟連結。

  由于硬連結是有着相同 inode 号僅檔案名不同的檔案,是以硬連結存在以下幾點特性:

檔案有相同的 inode 及 data block;

隻能對已存在的檔案進行建立;

不能交叉檔案系統進行硬連結的建立;

不能對目錄進行建立,隻可對檔案建立;

删除一個硬連結檔案并不影響其他有相同 inode 号的檔案。

  軟連結與硬連結不同,若檔案使用者資料塊中存放的内容是另一檔案的路徑名的指向,則該檔案就是軟連接配接。軟連結就是一個普通檔案,隻是資料塊内容有點特殊。軟連結有着自己的 inode 号以及使用者資料塊(見圖2)。是以軟連結的建立與使用沒有類似硬連結的諸多限制:

軟連結有自己的檔案屬性及權限等;

可對不存在的檔案或目錄建立軟連結;

軟連結可交叉檔案系統;

軟連結可對檔案或目錄建立;

建立軟連結時,連結計數 i_nlink 不會增加;

删除軟連結并不影響被指向的檔案,但若被指向的原檔案被删除,則相關軟連接配接被稱為死連結(即 dangling link,若被指向路徑檔案被重新建立,死連結可恢複為正常的軟連結)。

  圖2. 軟連結的通路

  由于inode号碼與檔案名分離,這種機制導緻了一些Unix/Linux系統特有的現象。

  1. 有時,檔案名包含特殊字元,無法正常删除。這時,直接删除inode節點,就能起到删除檔案的作用。

  2. 移動檔案或重命名檔案,隻是改變檔案名,不影響inode号碼。

  3. 打開一個檔案以後,系統就以inode号碼來識别這個檔案,不再考慮檔案名。是以,通常來說,系統無法從inode号碼得知檔案名。

  第3點使得軟體更新變得簡單,可以在不關閉軟體的情況下進行更新,不需要重新開機。因為系統通過inode号碼,識别運作中的檔案,不通過檔案名。更新的時候,新版檔案以同樣的檔案名,生成一個新的inode,不會影響到運作中的檔案。等到下一次運作這個軟體的時候,檔案名就自動指向新版檔案,舊版檔案的inode則被回收。

繼續閱讀