分享

hbase中的scan全表扫描,是所有的regionServer都并行扫描,还是一个regionServer完...

接纳自己:给位大神,hbase中的scan全表扫描,是所有的regionServer都并行扫描,还是一个regionServer完成后,下一个再开始

灰太狼:
对于客户端的scan,是逐个region的


接纳自己:
客户端的scan,是逐个访问regionServer的?
那这样了话,scan的全表扫描不就是串行扫描了吗

灰太狼:

你是顺序拿结果,他顺序扫是符合预期的
tableinputformat是并行的,每个region一个map
tableinputformat,内置的其实也是scan,在mr的需求下,就是并行的,每个mapper一个scan了


接纳自己:


mr里多个scan一起运行吗?


灰太狼:


每个mapper一个scan
每个scan扫一个region



接纳自己:

大概明白了,这样了话,当需要的数据分散在多个regionServer上时,客户端的scan扫描时间会很长


所以才要将单次访问需要的数据,行键设计一致,方便scan读取

明白了,谢了



感觉不错,整理自:about云2:hadoop、云技术【371358502】分享给大家






没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条