分享

服务器总是不定时重启

CCDK 2017-10-13 09:12:58 发表于 疑问解答 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 5 10799
几个节点里面,其它都正常,唯独有一个,一天自动重启无数次,还不定时。/var/log/message里面没有任何报错,目前能找到错误比较多的日志是:agent日志: cloudera-scm-agent.log.zip (9.53 KB, 下载次数: 2)

已有(5)人评论

跳转到指定楼层
CCDK 发表于 2017-10-13 09:14:34
本帖最后由 CCDK 于 2017-10-13 09:21 编辑

麻烦帮看下日志吧,里面有好多error暂时不知道怎么解决
回复

使用道具 举报

desehawk 发表于 2017-10-13 12:14:58

KeyError: 'getpwuid(): uid not found: 1106'
[13/Oct/2017 08:51:49 +0000] 5807 MainThread heartbeat_tracker INFO     HB stats (seconds): num:1 LIFE_MIN:0.06 min:0.06 mean:0.06 max:0.06 LIFE_MAX:0.06
[13/Oct/2017



IOError: [Errno 2] No such file or directory: '/opt/cm-5.7.5/run/cloudera-scm-agent/process/ccdeploy_hbase-conf_etchbaseconf.cloudera.hbase_-5150083351508936774/__cloudera_metadata__'
[13/Oct/2017 08:51:51 +0000] 5807


ERROR    Failed rack peer update: [Errno 111] Connection refused
[13/Oct/2017 08:51:51 +0000] 5807 MainThread firehoses    INFO     Reporting interval updated: 5.0 -> 60
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel


    ERROR    Failed to deactivate alternatives for parcel CDH-5.7.5-1.cdh5.7.5.p0.3: 2
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel


ERROR    Failed to deactivate alternatives for parcel CDH-5.7.5-1.cdh5.7.5.p0.3: 2
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel   


看下5807进程,是不是有以前的包

回复

使用道具 举报

CCDK 发表于 2017-10-13 15:19:49
desehawk 发表于 2017-10-13 12:14
KeyError: 'getpwuid(): uid not found: 1106'
[13/Oct/2017 08:51:49 +0000] 5807 MainThread heartbea ...

重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点能维持较久的时间,但是不保证可以长久存在。还是会有掉线的可能性,具体原因,真的不好找,能力有限了。
回复

使用道具 举报

desehawk 发表于 2017-10-13 18:05:21
CCDK 发表于 2017-10-13 15:19
重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点 ...

其它客户端如果不出现,说明agent的安装有问题。可以重新安装下。或则克隆一个节点,修改下相关参数
回复

使用道具 举报

奋斗男 发表于 2018-3-14 10:31:07
CCDK 发表于 2017-10-13 15:19
重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点 ...

兄弟,请问下,(29 skipped) Error getting directory attributes for /opt/cm-5.11.1/log/cloudera-scm-agentTraceback (most recent call last):  File "/opt/cm-5.11.1/lib64/cmf/agent/build/env/lib/python2.6/site-packages/cmf-5.11.1-py2.6.egg/cmf/monitor/dir_monitor.py", line 90, in _get_directory_attributes    name = pwd.getpwuid(uid)[0]KeyError: 'getpwuid(): uid not found: 1106'查看日志文件

我也有和你一样的问题,请问你解决了吗?方便的话留下联系方式,沟通下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条