分享

Cloudera Manager5 在线bin安装遇到 无法检测到 Agent 发出的检测信号 总结

pig2 发表于 2014-9-25 00:57:17 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 44 280005
巨波小学生 发表于 2017-2-16 18:22:47
分痴_mak3c 发表于 2016-1-26 14:57
**** 作者被禁止或删除 内容自动屏蔽 ****

我也遇到这个问题,上面的提示是网络问题,我检查了/etc/hosts  etc/syscofing/network-scripte/ifcfg-eth0   route 和/etc/resolv.conf,最后发现resolv.conf配置错误:[mw_shl_code=applescript,true][root@bqdps1 ~]# cat /etc/resolv.conf
; generated by /sbin/dhclient-script
search bf.cn
nameserver 10.0.0.6
nameserver 10.0.0.7[/mw_shl_code]

集群中其它主机:
[mw_shl_code=applescript,true][root@bqdps1 ~]# cat /etc/resolv.conf
nameserver 10.0.0.6
nameserver 10.0.0.7[/mw_shl_code]

而整个集群没有加入任何域,所有解析DNS出错.修改后agent就正常了
回复

使用道具 举报

canghaiyisu 发表于 2017-3-16 17:56:56
/var/log/message报错如下:
[mw_shl_code=applescript,true]cmf-agent: Starting daemon.
cmf-agent: Stopping daemon.[/mw_shl_code]

问题原因:
主机名中包含了下划线,而agent启动用到了python,从而产生了冲突。
回复

使用道具 举报

nextuser 发表于 2017-3-21 17:46:20
kass751 发表于 2017-3-21 17:01
Agent Status   
This host is in contact with the Cloudera Manager Server. This host is not in conta ...

是手工添加的,还是通过cloudera 功能自动添加的
首先本机配置是否配置完整,第二cloudera中是否添加hosts。别忘了master的改变相应的配置。然后最好重启下
Host Monitor和 cloudera-scm-server

sudo service cloudera-scm-server restart




回复

使用道具 举报

kass751 发表于 2017-3-22 11:36:41
nextuser 发表于 2017-3-21 17:46
是手工添加的,还是通过cloudera 功能自动添加的
首先本机配置是否配置完整,第二cloudera中是否添加hos ...

多谢回答
手工添加的 , 添加后可以在WEBUI中找到HOST,但是HealthTest一直不过.

>master的改变相应的配置
这句话是指什么?不明白,能详细说说吗.

另外在LOG中有这样的ERROR
Caught unexpected exception in main loop.Traceback (most recent call last):  File "/usr/lib64/cmf/agent/build/env/lib/python2.6/site-packages/cmf-5.10.0-py2.6.egg/cmf/agent.py", line 710, in __issue_heartbeat    self._init_after_first_heartbeat_response(resp_data)  File "/usr/lib64/cmf/agent/build/env/lib/python2.6/site-packages/cmf-5.10.0-py2.6.egg/cmf/agent.py", line 881, in _init_after_first_heartbeat_response    assert response_data.get("cm_guid") is not NoneAssertionError
回复

使用道具 举报

kass751 发表于 2017-3-22 13:35:02
SORRY 我没有注意到有可以发贴的地方
我在问题区重新开了贴子.
http://www.aboutyun.com/forum.ph ... id=21318&extra=
回复

使用道具 举报

Coroel 发表于 2017-4-16 23:24:39
楼主帮看看,在线安装时报Heartbeating错误。。。。。
Picture1.png
Capture2.PNG
Capture3.PNG
回复

使用道具 举报

Coroel 发表于 2017-4-16 23:25:14
楼主帮看看,在线安装时报Heartbeating错误。。。。。


回复

使用道具 举报

nextuser 发表于 2017-4-17 07:30:19
Coroel 发表于 2017-4-16 23:24
楼主帮看看,在线安装时报Heartbeating错误。。。。。

1服务器检测不到心跳,也就是说通信产生了问题。
其实上面已经给出了答案:
1.比如hostname是否正确。而且这里面不只是服务端,客户端也需要看下。hostname最好不好带点,类似域名,这样可能造成误解析。
确保9000段和9001没有被暂用。

sudo netstat -anp|grep 9000
更多参考
大数据集群【hadoop、hbase、spark、hive,zookeeper、storm等】故障排除之端口详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20880

2.检测下7182是否是通的
telnet master 7182
如果是Connection refused那就有问题
这个看到没有问题。还有就是sslerror unknown protocol
这个可能是没有服务器要求的客户端身份验证证书

3.是否启用了安全认证,不太熟悉的话,最好关闭掉。问题2可能由于这个原因

回复

使用道具 举报

Coroel 发表于 2017-4-17 10:22:04
nextuser 发表于 2017-4-17 07:30
1服务器检测不到心跳,也就是说通信产生了问题。
其实上面已经给出了答案:
1.比如hostname是否正确。 ...

谢谢回复先!
1,关于hostname,截图中已有列出。/etc/sysconfig/network中也是用的shortname.

[root@client1 ~]# netstat -anp|grep 9000
tcp        0      0 10.32.38.203:9000           0.0.0.0:*                   LISTEN      11050/python2.6
[root@client1 ~]#
[root@client1 ~]#
[root@client1 ~]# netstat -anp|grep 9001
tcp        0      0 127.0.0.1:19001             0.0.0.0:*                   LISTEN      11085/python
tcp        0      0 127.0.0.1:19001             127.0.0.1:33814             ESTABLISHED 11085/python
tcp        0      0 127.0.0.1:33814             127.0.0.1:19001             ESTABLISHED 11050/python2.6
[root@client1 ~]# hostname
client1
[root@client1 ~]# hostname -f
client1.poc-demo.tst
[root@client1 ~]#

2,端口7182是通的,9000是listen状态,9001也没被占用。

3,sslerror unknown protocol
这个可能是没有服务器要求的客户端身份验证证书,怎么更改设置?另外,如何查看是否启用了安全认证?目前就是一路NEXT下来的安装步骤。
回复

使用道具 举报

Coroel 发表于 2017-4-17 10:26:28
Install Java Unlimited Strength Encryption Policy Files
[加密的JDK没有勾选]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条