Hadoop大数据平台运维工程师须掌握的基本命令集分享

本博文收集和整理了在日常维护hadoop集群时运维工程师需要掌握的最基本的hadoop管理与维护的相关命令，在此分享出来供大家参考学习~博主也是刚刚接触hadoop不久，如有问题欢迎批评指正~非常感谢

1、列出所有Hadoop Shell支持的命令

$ bin/hadoop fs -help

2、显示关于某个命令的详细信息

$ bin/hadoop fs -help command-name

3、用户可使用以下命令在指定路径下查看历史日志汇总

$ bin/hadoop job -history output-dir #这条命令会显示作业的细节信息，失败和终止的任务细节。

4、关于作业的更多细节，比如成功的任务，以及对每个任务的所做的尝试次数等可以用下面的命令查看

$ bin/hadoop job -history all output-dir

5、格式化一个新的分布式文件系统：

$ bin/hadoop namenode -format

6、在分配的NameNode上，运行下面的命令启动HDFS：

$ bin/start-dfs.sh #脚本会参照NameNode上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上启动DataNode守护进程。

7、在分配的JobTracker上，运行下面的命令启动Map/Reduce：

$ bin/start-mapred.sh #脚本会参照JobTracker上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上启动TaskTracker守护进程。

8、在分配的NameNode上，执行下面的命令停止HDFS：

$ bin/stop-dfs.sh #脚本会参照NameNode上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上停止DataNode守护进程。

9、在分配的JobTracker上，运行下面的命令停止Map/Reduce：

$ bin/stop-mapred.sh #脚本会参照JobTracker上${HADOOP_CONF_DIR}/slaves文件的内容，在所有列出的slave上停止TaskTracker守护进程。

10、创建一个名为 /foodir 的目录

$ bin/hadoop dfs -mkdir /foodir

11、创建一个名为 /foodir 的目录

12、查看名为 /foodir/myfile.txt 的文件内容

$ bin/hadoop dfs -cat /foodir/myfile.txt

13、将集群置于安全模式

$ bin/hadoop dfsadmin -safemode enter

14、显示Datanode列表

$ bin/hadoop dfsadmin -report

15、使Datanode节点datanode name退役

$ bin/hadoop dfsadmin -decommission datanodename

16、bin/hadoop dfsadmin -help 命令能列出所有当前支持的命令。

比如：

* -report：报告HDFS的基本统计信息。有些信息也可以在NameNode Web服务首页看到。

* -safemode：虽然通常并不需要，但是管理员的确可以手动让NameNode进入或离开安全模式。

* -finalizeUpgrade：删除上一次升级时制作的集群备份。

17、显式地将HDFS置于安全模式

$ bin/hadoop dfsadmin -safemode

18、在升级之前，管理员需要用（升级终结操作）命令删除存在的备份文件

$ bin/hadoop dfsadmin -finalizeUpgrade

19、能够知道是否需要对一个集群执行升级终结操作。

$ dfsadmin -upgradeProgress status

20、使用-upgrade选项运行新的版本

$ bin/start-dfs.sh -upgrade

21、如果需要退回到老版本,就必须停止集群并且部署老版本的Hadoop，用回滚选项启动集群

$ bin/start-dfs.h -rollback

22、下面的新命令或新选项是用于支持配额，前两个是管理员命令。

* dfsadmin -setquota ...

把每个目录配额设为N。这个命令会在每个目录上尝试，如果N不是一个正的长整型数，目录不存在或是文件名或者目录超过配额则会产生错误报告。

* dfsadmin -clrquota ...

为每个目录删除配额。这个命令会在每个目录上尝试，如果目录不存在或者是文件，则会产生错误报告。如果目录原来没有设置配额不会报错。

* fs -count -q ...

使用-q选项，会报告每个目录设置的配额以及剩余配额。如果目录没有设置配额，会报告none和inf。

23、创建一个hadoop档案文件

$ hadoop archive -archiveName NAME *

#-archiveName NAME 要创建的档案的名字。

#src 文件系统的路径名，和通常含正则表达的一样。

#dest 保存档案文件的目标目录。

24、递归地拷贝文件或目录

$ hadoop distcp

srcurl 源uri

desturl 目标uri

25、运行HDFS文件系统检查工具(fsck tools)

用法：hadoop fsck [GENERIC_OPTIONS] [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]

命令选项描述

---------------------------------------------------------------------------------------------------------------------

检查的起始目录。

-move 移动受损文件到/lost+found

-delete 删除受损文件。

-openforwrite 打印出写打开的文件。

-files 打印出正被检查的文件。

-blocks 打印出块信息报告。

-locations 打印出每个块的位置信息。

-racks 打印出data-node的网络拓扑结构。

26、用于和Map Reduce作业交互和命令(jar)

用法：hadoop job [GENERIC_OPTIONS] [-submit ] | [-status ] |

[-counter ] | [-kill ] |

[-events ] | [-history [all] ] |

[-list [all]] | [-kill-task ] | [-fail-task ]

命令选项描述

-----------------------------------------------------------------------------------------------------------------------------

-submit 提交作业

-status 打印map和reduce完成百分比和所有计数器

-counter 打印计数器的值

-kill 杀死指定作业

-events 打印给定范围内jobtracker接收到的事件细节

-history [all] -history 打印作业的细节、失败及被杀死原因的细节

-list [all] -list all 显示所有作业 -list只显示将要完成的作业

-kill-task 杀死任务被杀死的任务不会不利于失败尝试

-fail-task 使任务失败被失败的任务会对失败尝试不利

27、运行pipes作业

用法：hadoop pipes [-conf ] [-jobconf , , ...] [-input ]

[-output ] [-jar ] [-inputformat ] [-map ] [-partitioner ]

[-reduce ] [-writer ] [-program ] [-reduces ]

命令选项描述

-conf 作业的配置

-jobconf , , ... 增加/覆盖作业的配置项

-input 输入目录

-output 输出目录

-jar Jar文件名

-inputformat InputFormat类

-map Java Map类

-partitioner Java Partitioner

-reduce Java Reduce类

-writer Java RecordWriter

-program 可执行程序的URI

-reduces reduce个数

28、打印版本信息。

用法：hadoop version

29、hadoop脚本可用于调调用任何类。

用法：hadoop CLASSNAME #运行名字为CLASSNAME的类。

30、运行集群平衡工具管理员可以简单的按Ctrl-C来停止平衡过程(balancer)

用法：hadoop balancer [-threshold ]

命令选项描述

--------------------------------------------------------------------------------

-threshold 磁盘容量的百分比。这会覆盖缺省的阀值。

31、获取或设置每个守护进程的日志级别(daemonlog)。

用法：hadoop daemonlog -getlevel

用法：hadoop daemonlog -setlevel

命令选项描述

-getlevel 打印运行在的守护进程的日志级别

-setlevel 设置运行在的守护进程的日志级别

32、运行一个HDFS的datanode。

用法：hadoop datanode [-rollback]

命令选项描述

-rollback 将datanode回滚到前一个版本。这需要在停止datanode，分发老的hadoop版本之后使用。

33、运行一个HDFS的dfsadmin客户端

用法：hadoop dfsadmin [GENERIC_OPTIONS] [-report] [-safemode enter | leave

| get | wait] [-refreshNodes] [-finalizeUpgrade] [-upgradeProgress status |

details | force] [-metasave filename] [-setQuota ...] [-clrQuota ...] [-help [cmd]]

34、运行MapReduce job Tracker节点(jobtracker)。

用法：hadoop jobtracker

35、运行namenode。有关升级，回滚，升级终结的更多信息请参考官方升级和回滚的文档信息

用法：hadoop namenode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint]

命令选项描述

-format 格式化namenode。它启动namenode，格式化namenode，之后关闭namenode

-upgrade 分发新版本的hadoop后，namenode应以upgrade选项启动

-rollback 将namenode回滚到前一版本。这个选项要在停止集群，分发老的hadoop版本后使用

-finalize finalize会删除文件系统的前一状态。最近的升级会被持久化，rollback选项将再不可用，升级终结操作之后会停掉namenode

-importCheckpoint 从检查点目录装载镜像并保存到当前检查点目录，检查点目录由fs.checkpoint.dir指定

36、运行HDFS的secondary namenode。

用法：hadoop secondarynamenode [-checkpoint [force]] | [-geteditsize]

命令选项描述

-checkpoint [force] 如果EditLog的大小>= fs.checkpoint.size启动Secondary namenode的检查点过程。若使用了-force将不考虑EditLog的大小

-geteditsize 打印EditLog大小。

37、运行MapReduce的task Tracker节点。

用法：hadoop tasktracker

38、显式地将HDFS置于安全模式

39、在升级之前，管理员需要用（升级终结操作）命令删除存在的备份文件

40、能够知道是否需要对一个集群执行升级终结操作。

41、使用-upgrade选项运行新的版本

42、如果需要退回到老版本,就必须停止集群并且部署老版本的Hadoop，用回滚选项启动集群

未完待续...........................

Hadoop大数据平台运维工程师须掌握的基本命令集分享

继续阅读

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

NOSQL安全攻击

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method