hdfs文件上传机制与namenode元数据管理机制总结:

2023-01-15 21:04:11

1.hdfs文件上传机制

文件上传过程:

　 1.客户端想NameNode申请上传文件，

　　2.NameNode返回此次上传的分配DataNode情况给客户端

　　3.客户端开始依向dataName上传对应的block数据块。

　　4.上传完成之后通知namenode，namenode利用pipe管道机制进行文件的备份，也就是一个集群中文件有好几个副本。

　　5.如果备份失败会将失败信息返回给namenode然后重新分配备节点，并利用pipe管道备份文件

2.NameNode管理元数据的机制

过程:

　　1.客户端上传文件时，首先向NameNode申请上传文件

　　2.NameNode首先往edit logs记录元数据操作日志(也就是记录block分配情况等数据)

　　3.NameNode将文件上传分配blk情况返回给客户端

　　4.客户端向dateNode上传文件

　　5.上传成功之后，客户端通知namenode文件上传完成

　　6.namenode将本次分配的日志信息读取到内存中(内存中记录最新的文件上传的元数据)，

　　7.为了防止内存数据丢失，需要将元数据进行持久化操作。每当editlogs快要写满时将这一段时间的log写入到fsimage中

3.NameNode将元数据持久化到磁盘的过程

过程:(为了防止进行editlog和fsimage合并浪费内存，因此将合并文件的操作在secondnode中进行)

　　1.当editlogs快要满的时候namenode通知secondnode进程checkpoint操作(合并操作)

　　2.secondnode收到通知后通知namenode停止向editlogs写日志，

　　3.此时为了不影响客户端继续上传文件，namenode新创一个文件叫做edits.new记录代替editlogs记录日志操作

　　4.secondnode将fsimage和editlogs下载进行合并，由于hadoop集成了jetty插件，因此通过http协议下载文件

　　5.下载完成之后secondnode利用自己的CPU，将editlogs按照fsimage的格式进行计算之后合并到fsimage完成合并，并将文件重命名为fsimage.chkpoint

　　6.合并完成之后上传给namenode。namenode删除原来的fsimage和edits，并将edits.new重命名为editlogs，将fsimage.chkpoint重新命名为fsimage。就可以进行正常的hdfs机制

1.　　什么时候checkpiont

　　fs.checkpoint.period 指定两次checkpoint的最大时间间隔，默认3600秒。

　　fs.checkpoint.size 规定edits文件的最大值，一旦超过这个值则强制checkpoint，不管是否到达最大时间间隔。默认大小是64M

总结:

　　(1)上面的机制就保证断点之后fsimage有大部分的元数据信息，editlogs有最新的元数据信息，内存中也有最新的元数据信息，这样断电之后也不会丢失数据。同时客户端查询数据的时候也会从内存中读取而不会影响速度。

　　(2)NameNode的作用:

维护元数据信息
维护hdfs的目录树
响应客户端请求

　　(3)namenode工作特点

　　　　Namenode始终在内存中保存metedata，用于处理“读请求”

　　　　到有“写请求”到来时，namenode会首先写editlog到磁盘，即向edits文件中写日志，成功返回后，才会修改内存，并且向客户端返回

　　　　Hadoop会维护一个fsimage文件，也就是namenode中metedata的镜像，但是fsimage不会随时与namenode内存中的metedata保持一致，而是每隔一段时间通过合并edits文件来更新内容。Secondary namenode就是用来合并fsimage和edits文件来更新NameNode的metedata的。

hdfs文件上传机制与namenode元数据管理机制总结:

1.hdfs文件上传机制

2.NameNode管理元数据的机制

3.NameNode将元数据持久化到磁盘的过程

1.　　什么时候checkpiont

总结:

继续阅读

一文读懂夏窗：1.16亿两标王！切尔西4.6亿创纪录皇马拜仁豪购

伦敦三雄近10亿引援！曼城用2.4亿巩固优势西甲变强了？

夏窗没实现转会：新月无缘梅西姆巴佩！姆总没去皇马内马尔未回巴萨

5年1.43亿英镑！曼城将与哈兰德续约，拒绝被沙特皇马挖角

西甲：孔德破门莱万86分钟点杀巴萨2-1险胜奥萨苏纳

不只是皇马会绝杀！有了葡萄牙双星，巴萨变强了多少？

249场357球！巴萨16岁妖星9年连升12级，梦想世界杯夺冠

现实版的日本大空翼，久保健英将成西甲顶级球星？

一文读懂沙特联关窗：砸9.5亿世界第二！内马尔本泽马领衔十大交易

华西金堂医院到三益康养公司开展院企党建共建主题党日活动

从贝林厄姆到上古大神，谁是足坛最强六边形战士？

足坛精彩1夜！皇马逆转5连胜阿森纳小胜切尔西闷平罗马7-0

欧冠今夜19看点：死亡之组捉对厮杀！姆巴佩哈兰德隔空PK 巴萨出战

人物志 | 菲利克斯：坚持加盟巴萨让他重获新生蜕变正当时

哈维手握说明书，巴萨体系激活菲利克斯，不用回马竞了吧？

2000万打水漂？皇马官宣18岁新援再受伤缺阵3周，被截胡的巴萨笑了

hdfs文件上传机制与namenode元数据管理机制总结:

1.hdfs文件上传机制

2.NameNode管理元数据的机制

3.NameNode将元数据持久化到磁盘的过程

1. 什么时候checkpiont

总结:

继续阅读

1.　　什么时候checkpiont