天天看點

FAT檔案系統原理

一、硬碟的實體結構:

硬碟存儲資料是根據電、磁轉換原理實作的。硬碟由一個或幾個表面鍍有磁性物質的金屬或玻璃等物質盤片以及盤片兩面所安裝的磁頭和相應的控制電路組成(圖1),其中盤片和磁頭密封在無塵的金屬殼中。

硬碟工作時,盤片以設計轉速高速旋轉,設定在盤片表面的磁頭則在電路控制下徑向移動到指定位置然後将資料存儲或讀取出來。當系統向硬碟寫入資料時,磁頭中“寫資料”電流産生磁場使盤片表面磁性物質狀态發生改變,并在寫電流磁場消失後仍能保持,這樣資料就存儲下來了;當系統從硬碟中讀資料時,磁頭經過盤片指定區域,盤片表面磁場使磁頭産生感應電流或線圈阻抗産生變化,經相關電路處理後還原成資料。是以隻要能将盤片表面處理得更平滑、磁頭設計得更精密以及盡量提高盤片旋轉速度,就能造出容量更大、讀寫資料速度更快的硬碟。這是因為盤片表面處理越平、轉速越快就能越使磁頭離盤片表面越近,提高讀、寫靈敏度和速度;磁頭設計越小越精密就能使磁頭在盤片上占用空間越小,使磁頭在一張盤片上建立更多的磁道以存儲更多的資料。二、硬碟的邏輯結構。

硬碟由很多盤片(platter)組成,每個盤片的每個面都有一個讀寫磁頭。如果有N個盤片。就有2N個面,對應2N個磁頭(Heads),從0、1、2開始編号。每個盤片被劃分成若幹個同心圓磁道(邏輯上的,是不可見的。)每個盤片的劃分規則通常是一樣的。這樣每個盤片的半徑均為固定值R的同心圓再邏輯上形成了一個以電機主軸為軸的柱面(Cylinders),從外至裡編号為0、1、2......每個盤片上的每個磁道又被劃分為幾十個扇區(Sector),通常的容量是512byte,并按照一定規則編号為1、2、3......形成Cylinders×Heads×Sector個扇區。這三個參數即是硬碟的實體參數。我們下面的很多實踐需要深刻了解這三個參數的意義。

三、磁盤引導原理。3.1 MBR(master boot record)扇區:

計算機在按下power鍵以後,開始執行主機闆bios程式。

進行完一系列檢測和配置以後。開始按bios中設定的系統引導順序引導系統。假定現在是硬碟。Bios執行完自己的程式後如何把執行權交給硬碟呢。交給硬碟後又執行存儲在哪裡的程式呢。其實,稱為mbr的一段代碼起着舉足輕重的作用。MBR(master boot record),即主引導記錄,有時也稱主引導扇區。位于整個硬碟的0柱面0磁頭1扇區(可以看作是硬碟的第一個扇區),bios在執行自己固有的程式以後就會jump到mbr中的第一條指令。将系統的控制權交由mbr來執行。在總共512byte的主引導記錄中,MBR的引導程式占了其中的前446個位元組(偏移0H~偏移1BDH),随後的64個位元組(偏移1BEH~偏移1FDH)為DPT(Disk

PartitionTable,硬碟分區表),最後的兩個位元組“55 AA”(偏移1FEH~偏移1FFH)是分區有效結束标志。

MBR不随作業系統的不同而不同,意即不同的作業系統可能會存在相同的MBR,即使不同,MBR也不會夾帶作業系統的性質。具有公共引導的特性。

我們來分析一段mbr。下面是用winhex檢視的一塊希捷120GB硬碟的mbr。

我們看DPT部分。作業系統為了便于使用者對磁盤的管理。加入了磁盤分區的概念。即将一塊磁盤邏輯劃分為幾塊。磁盤分區數目的多少隻受限于C~Z的英文字母的數目,在上圖DPT共64個位元組中如何表示多個分區的屬性呢? Microsoft通過連結的方法解決了這個問題。在DPT共64個位元組中,以16個位元組為分區表項機關描述一個分區的屬性。也就是說,第一個分區表項描述一個分區的屬性,一般為基本分區。第二個分區表項描述除基本分區外的其餘空間,一般而言,就是我們所說的擴充分區。這部分的大體說明見表1。

表1 圖2分區表第一字段

位元組位移

字段長度

字段名和定義

0x01BE

BYTE

0x80

引導訓示符(Boot Indicator)指明該分區是否是活動分區。

0x01BF

0x01

開始磁頭(Starting Head)

0x01C0

6位

開始扇區(Starting Sector)隻用了0~5位。後面的兩位(第6位和第7位)被開始柱面字段所使用

0x01C1

10位

0x00

開始柱面(Starting Cylinder)除了開始扇區字段的最後兩位外,還使用了1位來組成該柱面值。開始柱面是一個10位數,最大值為1023

0x01C2

0x07

系統ID(System ID)定義了分區的類型,詳細定義,請參閱圖4

0x01C3

0xFE

結束磁頭(Ending Head)

0x01C4

0xFF

結束扇區(Ending Sector)隻使用了0~5位。最後兩位(第6、7位)被結束柱面字段所使用

0x01C5

0x7B

結束柱面(Ending Cylinder)除了結束扇區字段最後的兩位外,還使用了1位,以組成該柱面值。結束柱面是一個10位的數,最大值為1023

0x01C6

DWORD

0x0000003F

相對扇區數(Relative Sectors) 從該磁盤的開始到該分區的開始的位移量,以扇區來計算

0x01CA

0x00DAA83D

總扇區數(Total Sectors)該分區中的扇區總數

注:上表中的超過1位元組的資料都以實際資料顯示,就是按高位到地位的方式顯示。存儲時是按低位到高位存儲的。兩者表現不同,請仔細看清楚。以後出現的表,圖均同。也可以在winhex中看到這些參數的意義:

說明: 每個分區表項占用16個位元組,假定偏移位址從0開始。如圖3的分區表項3。分區表項4同分區表項3。

1、0H偏移為活動分區是否标志,隻能選00H和80H。80H為活動,00H為非活動。其餘值對microsoft而言為非法值。

2、重新說明一下(這個非常重要):大于1個位元組的數被以低位元組在前的存儲格式格式(little endian format) 或稱反位元組順序儲存下來。低位元組在前的格式是一種儲存數的方法,這樣,最低位的位元組最先出現在十六進制數符号中。例如,相對扇區數字段的值0x3F000000的低位元組在前表示為0x0000003F。這個低位元組在前的格式數的十進制數為63。

3、系統在分區時,各分區都不允許跨柱面,即均以柱面為機關,這就是通常所說的分區粒度。有時候我們分區是輸入分區的大小為7000M,分出來卻是6997M,就是這個原因。 偏移2H和偏移6H的扇區和柱面參數中,扇區占6位(bit),柱面占10位(bit),以偏移6H為例,其低6位用作扇區數的二進制表示。其高兩位做柱面數10位中的高兩位,偏移7H組成的8位做柱面數10位中的低8位。由此可知,實際上用這種方式表示的分區容量是有限的,柱面和磁頭從0開始編号,扇區從1開始編号,是以最多隻能表示1024個柱面×63個扇區×256個磁頭×512byte=8455716864byte。即通常的8.4GB(實際上應該是7.8GB左右)限制。實際上磁頭數通常隻用到255個(由彙編語言的尋址寄存器決定),即使把這3個位元組按線性尋址,依然力不從心。

在後來的作業系統中,超過8.4GB的分區其實已經不通過C/H/S的方式尋址了。而是通過偏移CH~偏移FH共4個位元組32位線性扇區位址來表示分區所占用的扇區總數。可知通過4個位元組可以表示2^32個扇區,即2TB=2048GB,目前對于大多數計算機而言,這已經是個天文數字了。在未超過8.4GB的分區上,C/H/S的表示方法和線性扇區的表示方法所表示的分區大小是一緻的。也就是說,兩種表示方法是協調的。即使不協調,也以線性尋址為準。(可能在某些系統中會提示出錯)。超過8.4GB的分區結束C/H/S一般填充為FEH

FFH FFH。即C/H/S所能表示的最大值。有時候也會用柱面對1024的模來填充。不過這幾個位元組是什麼其實都無關緊要了。

雖然現在的系統均采用線性尋址的方式來處理分區的大小。但不可跨柱面的原則依然沒變。本分區的扇區總數加上與前一分區之間的保留扇區數目依然必須是柱面容量的整數倍。(保留扇區中的第一個扇區就是存放分區表的MBR或虛拟MBR的扇區,分區的扇區總數線上性表示方式上是不計入保留扇區的。如果是第一個分區,保留扇區是本分區前的所有扇區。

附:分區表類型标志如圖4

3.2 擴充分區:

擴充分區中的每個邏輯驅動器都存在一個類似于MBR的擴充引導記錄( Extended Boot Record, EBR),也有人稱之為虛拟mbr或擴充mbr,意思是一樣的。擴充引導記錄包括一個擴充分區表和該扇區的标簽。擴充引導記錄将記錄隻包含擴充分區中每個邏輯驅動器的第一個柱面的第一面的資訊。一個邏輯驅動器中的引導扇區一般位于相對扇區32或63。但是,如果磁盤上沒有擴充分區,那麼就不會有擴充引導記錄和邏輯驅動器。第一個邏輯驅動器的擴充分區表中的第一項指向它自身的引導扇區。第二項指向下一個邏輯驅動器的EBR。如果不存在進一步的邏輯驅動器,第二項就不會使用,而且被記錄成一系列零。如果有附加的邏輯驅動器,那麼第二個邏輯驅動器的擴充分區表的第一項會指向它本身的引導扇區。第二個邏輯驅動器的擴充分區表的第二項指向下一個邏輯驅動器的EBR。擴充分區表的第三項和第四項永遠都不會被使用。

通過一幅4分區的磁盤結構圖可以看到磁盤的大緻組織形式。如圖5:

關于擴充分區,如圖6所示,擴充分區中邏輯驅動器的擴充引導記錄是一個連接配接表。該圖顯示了一個擴充分區上的三個邏輯驅動器,說明了前面的邏輯驅動器和最後一個邏輯驅動器之間在擴充分區表中的差異。

除了擴充分區上最後一個邏輯驅動器外,表2中所描述的擴充分區表的格式在每個邏輯驅動器中都是重複的:第一個項辨別了邏輯驅動器本身的引導扇區,第二個項辨別了下一個邏輯驅動器的EBR。最後一個邏輯驅動器的擴充分區表隻會列出它本身的分區項。最後一個擴充分區表的第二個項到第四個項被使用。

表2 擴充分區表項的内容

擴充分區表項

分區表項的内容

第一個項

包括資料的開始位址在内的與擴充分區中目前邏輯驅動器有關的資訊

第二個項

有關擴充分區中的下一個邏輯驅動器的資訊,包括包含下一個邏輯驅動器的DBR的扇區的位址。如果不存在進一步的邏輯驅動器的話,該字段不會被使用。

第三個項

未用

第四個項

擴充分區表項中的相對扇區數字段所顯示的是從擴充分區開始到邏輯驅動器中第一個扇區的位移的位元組數。總扇區數字段中的數是指組成該邏輯驅動器的扇區數目。總扇區數字段的值等于從擴充分區表項所定義的引導扇區到邏輯驅動器末尾的扇區數。有時候在磁盤的末尾會有剩餘空間,剩餘空間是什麼呢?我們前面說到,分區是以1柱面的容量為分區粒度的,那麼如果磁盤總空間不是整數個柱面的話,不夠一個柱面的剩下的空間就是剩餘空間了,這部分空間并不參與分區,是以一般無法利用。照道理說,磁盤的實體模式決定了磁盤的總容量就應該是整數個柱面的容量,為什麼會有不夠一個柱面的空間呢。在我的了解看來,本來現在的磁盤為了更大的利用空間,一般在實體上并不是按照外圍的扇區大于裡圈的扇區這種管理方式,隻是為了與作業系統相容而抽象出來CHS。可能其實際空間容量不一定正好為整數個柱面的容量。