搜索
搜 索
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
›
日志
发布
日志
上传
相册
添加
分享
记录
日志
好友的日志
我的日志
随便看看
发表新日志
遇到过的问题
|
备忘录
|
求分享
|
转载
|
面试题
|
分享
一个很小的表和一个超级大表关联,用Hadoop怎么处理?
redhat1986
2016-4-13 20:51
MapReduce中的join分为好几种,比如有最常见的 reduce side join、map side join和semi join 等。reduce join 在shuffle阶段要进行大量的数据传输,会造成大量的网络IO效率低下,而map side join 在处理多个小表关联大表时非常有用 。 Map side join是针对以下场景进行的优化:两个待连接表中,有一个表非常大,而 ...
个人分类:
面试题
|
1508 次阅读
|
0
个评论
分享
Hive 面试题
redhat1986
2015-6-2 10:37
表结构: uid datetime device_id xxx xxx 111  ...
个人分类:
面试题
|
1736 次阅读
|
1
个评论
热度
2
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈