一、Hadoop Yarn shell命令集群监控与管理
yarn由bin/yarn下面的脚本调用。不带任何参数运行yarn脚本会打印所有命令的描述。
常用的yarn命令:(摘自http://blog.csdn.net/smile_to_life/article/details/54020298)
1.运行一个jar文件
用户可以捆绑yarn代码在一个jar文件,然后使用这个命令执行。
用法:yarn jar [mainClass] args...
2.打印应用程序的报告和kill掉的应用程序
用法:yarn application
命令选项
描述
-applicationId ApplicationId
指定一个应用程序ID(application id)
-appOwner AppOwner
指定一个 程序拥有者(application owner)
-containerId ContainerId
指定一个容器ID(container id)
-nodeAddress NodeAddress
指定一个节点地址( node address)
3.打印节点报告
用法:yarn node
命令选项
描述
-status NodeId
指定一个节点ID(node id)
-list
列出所有节点列表信息
4.转储容器日志
用法:yarn logs
-applicationId ApplicationId
指定一个应用程序id( application id),查看该Id的运行日志(日志包含运行期间的一切程序输出)
-appOwner AppOwner
指定一个程序拥有者( application owner)
-containerId ContainerId
指定一个容器id(container id)
-nodeAddress NodeAddress
指定一个节点地址( node address)
5.启动资源管理(resourceManager)
用法:yarn resourcemanager
6.启动节点管理(nodemanager)
用法:yarn nodemanager
7.启动代理服务(proxyserver)
用法:yarn proxyserver
8.运行ResourceManager管理客户端
用法:yarn rmadmin
命令选项
描述
-refreshQueues
刷新队列的ACL,状态和调度程序特定的属性。ResourceManager将刷新 mapred-queues的配置文件。
-refreshNodes
刷新在ResourceManager中的主机信息。
-refreshUserToGroupsMappings
刷新用户到组的映射。
-refreshSuperUserGroupsConfiguration
刷新超级用户代理组的映射。
-refreshAdminAcls
刷新ACL的ResourceManager的管理
-refreshServiceAcl
刷新服务级授权策略文件。ResoureceManager将重新加载授权策略文件。
-help [cmd]
显示帮助对于给定的命令或如果没有指定显示所有命令。
二、Hadoop Yarn管理REST API使用
按照官方的解释:“HadoopYARN的web服务 REST API是一组向集群,节点,应用程序和应用历史信息提供访问的URI资源,该URI资源被分组为基于返回的信息的类型的API。一些URI资源返回集合而另一些返回单个信息。”我个人理解这REST API就是给我们提供一些管理方法的接口。
它的基本格式是
GEThttp://{http address of service}/ws/{version}/{resourcepath}
http address of servicel:该服务的http地址获取有关信息
version:API的版本
resourcepath:他定义了一个单例资源或资源集合路径
我们来试一试,我们在分节点上执行pi的Hadoop任务
然后我们就可以看到一串信息
我们在主节点执行开始说的GET命令,把图中的url复制进去
这个就是获取正在执行的job信息,以JSON格式返回
还有其他比如:Map任务已经完成,但是reduce任务仍然在运行,job已经完成,用户希望看到该作业的历史服务最后信息,获得ResourceManager的最后信息等等,都是以类似方法执行。