天天看点

CHECKPOINT

CHECKPOINT

Checkpoint理解:

HDFS中name node不能是单个程序在运行,因为如果这个程序突然关闭,元数据将不能找回。

所以对于以上问题就出现了secondary  namenode。这个程序就是辅助name node操作元数据的。

1. name node记录元数据,当文件到达某一指定的大小之后,存到本地磁盘中,并且生成一个镜像文件。

2. secondary namenode程序收集镜像文件和记录元数据的文件,并将镜像文件加载到内存,同时元数据文件也加载到内存

3. 在secondary namenode程序就将元数据文件和镜像文件一起序列化成一个新的文件。

4. 再将这个新的文件传到name node 中,同时自己也备份一个,积累到指定的时间就丢弃旧的文件。

5. 如果name node宕机,secondary namenode不会代替name node进行工作,只是帮name node保存数据并提示尽快修好并运行name node。

继续阅读