HDFS文件上传加速问题

查看数: 25410 | 评论数: 7 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2016-6-28 11:43

正文摘要:

本帖最后由 cwalet 于 2016-6-28 11:45 编辑 version:Hadoop 2.7.2(HA模式) blocksize:128M(default) DFS Used: 240 TB DFS Used%: 40% Under replicated blocks: 0 Blocks with corrupt replicas: ...

回复

mrcui 发表于 2016-7-13 11:43:30
做大数据系统,优化和部署对性能影响非常大,put的速度慢,可以从以下入手
1、是客户端的对文件系统的读出速度,这时起步;
2、看客户端与hadoop集群之间的带宽,客户端实际上是把数据直接分发到各个datanode的,网络带宽如果不够,那速度快不了,这时限制大数据的一个重要瓶颈。
3、集群上是否存在IO占用非常高的datanode;
以上三点是解决Put速度慢的方法, 其实各种IT问题都类似,解决思路也是类似。
zhou4304261988 发表于 2016-7-11 14:55:57
看看评论
xw2016 发表于 2016-6-30 12:37:32
只看看
恋枫缩影 发表于 2016-6-29 08:57:42
hadoop各个节点nameNode、dataNode之间都是通过rpc进行通信的,尽量保持每个节点都有足够的内存才能保持整个分布式系统的性能。
qcbb001 发表于 2016-6-28 15:09:30
cwalet 发表于 2016-6-28 14:54
目前所有datanode内存都是用满的,free:0
但是这跟节点内存有直接关系吗?
namenode的内存只用了1/3, ...

hadoop是分布式的,也可以说他们是一体的。
如果有的客户端慢,可能会影响速度的。他们之间是需要通信的,如果一台机器反映不过来,可能就会造成效率降低
cwalet 发表于 2016-6-28 14:54:33
本帖最后由 cwalet 于 2016-6-28 14:55 编辑
qcbb001 发表于 2016-6-28 14:38
楼主先确保每个客户端的内存足够用。是否整台机器都慢。

目前所有datanode内存都是用满的,free:0
但是这跟节点内存有直接关系吗?
namenode的内存只用了1/3,剩余40G,ls命令主要是受namenode影响吧?而且现在双namenode都不慢。
qcbb001 发表于 2016-6-28 14:38:18
楼主先确保每个客户端的内存足够用。是否整台机器都慢。
关闭

推荐上一条 /2 下一条