初識

核心分布式記算架構：MapReduce

[3]入門大資料-HadoopHDFS初識

官方文檔

NN:
(1) 負責響應用戶端請求
(2)管理中繼資料（檔案名、副本、block存放的DN）

DN:
(1)使用者檔案對應的block
(2)回報block資訊、健康狀況

The File System Namespace

能創件目錄、存儲檔案

做修改都會被記錄下來，應用程式可以指定，拷貝的數量稱為 replication factor （副本系數）
Data Replication副本機制

(1)為了容錯，會以多副本的形态存放。

(2)一個檔案除了最後一個Block外，都會是一樣大小。

(3)HDFS隻能寫一次

(4)由NameNode管理（Blockreport）

Blockreport包含以下資訊：檔案名、系數、block id
副本存放政策

選擇block存放原則：第一個同節點、第二份放不同Rack、第三份與第二放同Rack不同節點