about云开发-活到老 学到老

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1809|回复: 5

[疑问解答] 服务器总是不定时重启

[复制链接]

13

主题

4

听众

0

收听

中级会员

Rank: 3Rank: 3

积分
416
发表于 2017-10-13 09:12:58 | 显示全部楼层 |阅读模式
几个节点里面,其它都正常,唯独有一个,一天自动重启无数次,还不定时。/var/log/message里面没有任何报错,目前能找到错误比较多的日志是:agent日志: cloudera-scm-agent.log.zip (9.53 KB, 下载次数: 2)

13

主题

4

听众

0

收听

中级会员

Rank: 3Rank: 3

积分
416
 楼主| 发表于 2017-10-13 09:14:34 | 显示全部楼层
本帖最后由 CCDK 于 2017-10-13 09:21 编辑

麻烦帮看下日志吧,里面有好多error暂时不知道怎么解决
发表于 2017-10-13 12:14:58 | 显示全部楼层

KeyError: 'getpwuid(): uid not found: 1106'
[13/Oct/2017 08:51:49 +0000] 5807 MainThread heartbeat_tracker INFO     HB stats (seconds): num:1 LIFE_MIN:0.06 min:0.06 mean:0.06 max:0.06 LIFE_MAX:0.06
[13/Oct/2017



IOError: [Errno 2] No such file or directory: '/opt/cm-5.7.5/run/cloudera-scm-agent/process/ccdeploy_hbase-conf_etchbaseconf.cloudera.hbase_-5150083351508936774/__cloudera_metadata__'
[13/Oct/2017 08:51:51 +0000] 5807


ERROR    Failed rack peer update: [Errno 111] Connection refused
[13/Oct/2017 08:51:51 +0000] 5807 MainThread firehoses    INFO     Reporting interval updated: 5.0 -> 60
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel


    ERROR    Failed to deactivate alternatives for parcel CDH-5.7.5-1.cdh5.7.5.p0.3: 2
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel


ERROR    Failed to deactivate alternatives for parcel CDH-5.7.5-1.cdh5.7.5.p0.3: 2
[13/Oct/2017 08:51:51 +0000] 5807 MainThread parcel   


看下5807进程,是不是有以前的包

13

主题

4

听众

0

收听

中级会员

Rank: 3Rank: 3

积分
416
 楼主| 发表于 2017-10-13 15:19:49 | 显示全部楼层
desehawk 发表于 2017-10-13 12:14
KeyError: 'getpwuid(): uid not found: 1106'
[13/Oct/2017 08:51:49 +0000] 5807 MainThread heartbea ...

重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点能维持较久的时间,但是不保证可以长久存在。还是会有掉线的可能性,具体原因,真的不好找,能力有限了。
发表于 2017-10-13 18:05:21 | 显示全部楼层
CCDK 发表于 2017-10-13 15:19
重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点 ...

其它客户端如果不出现,说明agent的安装有问题。可以重新安装下。或则克隆一个节点,修改下相关参数

0

主题

2

听众

0

收听

新手上路

Rank: 1

积分
41
发表于 2018-3-14 10:31:07 | 显示全部楼层
CCDK 发表于 2017-10-13 15:19
重新启程了好几次,查看日志,基本没有那个进程相关的信息。主要是会出现一些文件空白,增加进去后,节点 ...

兄弟,请问下,(29 skipped) Error getting directory attributes for /opt/cm-5.11.1/log/cloudera-scm-agentTraceback (most recent call last):  File "/opt/cm-5.11.1/lib64/cmf/agent/build/env/lib/python2.6/site-packages/cmf-5.11.1-py2.6.egg/cmf/monitor/dir_monitor.py", line 90, in _get_directory_attributes    name = pwd.getpwuid(uid)[0]KeyError: 'getpwuid(): uid not found: 1106'查看日志文件

我也有和你一样的问题,请问你解决了吗?方便的话留下联系方式,沟通下
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

QQ|小黑屋|about云开发-学问论坛|社区-大数据云技术学习分享平台 ( 京ICP备12023829号

GMT+8, 2018-6-23 22:05 , Processed in 0.380003 second(s), 32 queries , Gzip On.

Powered by Discuz! X3.2 Licensed

© 2018 Comsenz Inc.Designed by u179

快速回复 返回顶部 返回列表