`
dajuezhao
  • 浏览: 59564 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JobClient应用概述

阅读更多
一、应用背景

由于在设计中有一个模块是对Job的管理,所以,在这里我采用了JobClinet来进行简单的控制。

二、应用点

JobClient指的是org.apache.hadoop.mapred.JobClient这个类。里面有不少的方法,我这里列举一些我用到的和一些需要注意的方法。

1、JobClient的实例化。这里有2中方法,一种是new JobClient(new JobConf);另外一种是实例化IP地址和端口。

2、通过JobClient获取Job列表。

JobClient.jobsToComplete()返回没有完成和没有失败的Job。换句话说就是在运行的Job。

JobClient.getAllJobs()返回所有的Job,不管是失败还是成功的。

3、获取JobID

JobID是一个Job的唯一标识,如果要获取指定的JobID,那么需要有根据,例如UserName。我这里是通过User来获取JobID。方法是遍历Job,然后找到名称相匹配的Job,然后取出ID。

4、通过线程阻塞的模式来等待Job执行完成。

JobClient.getJob(JobID).waitForCompletion();

三、总结

1、JobClient的应用很简单,总的说来就那么几种,细致看一下API就会大部分的应用。

2、通过JobClient还可以对task进行监控,也可以获取Job的进度百分比。

3、写的比较简单,写的不对或是有疑问可以发邮件dajuezhao@gmail.com
分享到:
评论
1 楼 scu_cxh 2012-04-13  
您好,我在学习hadoop方面的东西,想做一个对task监控的工具,但是没有什么思路,上面看到您提到可以通过JobClient可以监控到task的情况,能否指点下?

相关推荐

Global site tag (gtag.js) - Google Analytics