分享

oozie定时spark2的任务一直running,并且查看任务发现有异常,但还是running

具体异常错误:2018-06-30 17:13:01,289 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Got allocated containers 12018-06-30 17:13:01,290 ERROR [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMCommunicator: ERROR IN CONTACTING RM. java.lang.ArithmeticException: / by zero        at org.apache.hadoop.mapreduce.v2.app.rm.ResourceCalculatorUtils.computeAvailableContainers(ResourceCalculatorUtils.java:38)        at org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator$ScheduledRequests.assign(RMContainerAllocator.java:1028)        at org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator$ScheduledRequests.access$200(RMContainerAllocator.java:920)        at org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator.heartbeat(RMContainerAllocator.java:258)        at org.apache.hadoop.mapreduce.v2.app.rm.RMCommunicator$AllocatorRunnable.run(RMCommunicator.java:281)        at java.lang.Thread.run(Thread.java:745)2018-06-30 17:13:02,291 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Before Scheduling: PendingReds:0 ScheduledMaps:1 ScheduledReds:0 AssignedMaps:0 AssignedReds:0 CompletedMaps:0 CompletedReds:0 ContAlloc:1 ContRel:0 HostLocal:0 RackLocal:0

已有(4)人评论

跳转到指定楼层
tuzhaoguo 发表于 2018-6-30 17:49:30
有人能帮忙解决一下吗?
回复

使用道具 举报

sstutu 发表于 2018-7-1 13:32:02
tuzhaoguo 发表于 2018-6-30 17:49
有人能帮忙解决一下吗?

Yarn可能出问题了。看下resourcemanager是否还在,是否有僵尸进程。
回复

使用道具 举报

tuzhaoguo 发表于 2018-7-2 08:36:40
sstutu 发表于 2018-7-1 13:32
Yarn可能出问题了。看下resourcemanager是否还在,是否有僵尸进程。

主节点的resourcemanager还在的,主要是我运行一个wordcount的spark2的程序就会运行成功,不会一直卡在running状态。还有一个就是recoursemanager的日志文件一直在请求这个任务,下面是请求的日志
早上8点28:29.647分
INFO
WebAppProxyServlet
dr.who is accessing unchecked http://bd-05:43188/ws/v1/mapreduce/jobs/job_1530347849460_0002 which is the app master GUI of application_1530347849460_0002 owned by hdfs
早上8点28:32.181分
INFO
WebAppProxyServlet
dr.who is accessing unchecked http://bd-14:40050/ws/v1/mapreduce/jobs/job_1530347849460_0003 which is the app master GUI of application_1530347849460_0003 owned by hdfs

回复

使用道具 举报

tuzhaoguo 发表于 2018-7-6 10:36:40
资源分配的问题吧,我的oozie任务,所以在workflow.xml中添加sparkopts的配置,配置相应参数,问题消失。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条