发布日期:2015-12-07 14:15 来源: 标签: 云计算与大数据 Hadoop教程 namenode和tasktracker命令 secondarynamenode命令
本章我们主要学习Hadoop中namenode、secondarynamenode和tasktracker命令,下面我们就做一下具体讲解,希望大家多多支持中国站长网络学院。
namenode 
运行namenode。有关升级,回滚,升级终结的更多信息请参考升级和回滚。 
用法:
hadoop namenode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint] 

secondarynamenode 
运行 HDFS 的secondary namenode。 
用法:
hadoop secondarynamenode [-checkpoint [force]] | [-geteditsize] 

tasktracker 
运行 MapReduce 的task Tracker 节点。 
用法:hadoop tasktracker 
常用命令 
这部分内容其实可以通过命令的 Help 以及介绍了解,这里主要侧重于介绍一下我用的比较多的几个命令。Hadoop dfs  这个命令后面加参数就是对于 HDFS 的操作,和Linux 操作系统的命令很类似,例如: 
• Hadoop dfs –ls就是查看/usr/root 目录下的内容,默认如果不填路径这就是当前用户路径; 
• Hadoop dfs –rmr xxx就是删除目录,还有很多命令看看就很容易上手; 
• Hadoop dfsadmin –report这个命令可以全局的查看DataNode的情况; 
• Hadoop job后面增加参数是对于当前运行的Job的操作,例如list,kill等; 
• Hadoop balancer就是前面提到的均衡磁盘负载的命令。

相关评论

专题信息
    Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。Hadoop框架中最核心的设计就是:MapReduce和HDFS。MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。本教程对Hadoop做了详解的介绍与讲解,教程中的实例能让大家更快的学习Hadoop,望大家多多支持中国站长网络学院。