搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
关于MapReduce中多个reduce输出的问题
0
6
0
分享
关于MapReduce中多个reduce输出的问题
soony_007
发表于 2013-10-16 13:38:47
[显示全部楼层]
阅读模式
关闭右栏
6
45558
About云VIP帮助找工作和提升
本帖最后由 nettman 于 2013-10-27 15:15 编辑
每个reduce task都会向HDFS写入自己的输出文件吗?
这些输出文件会进行合并吗?
求指教,谢谢
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(6)人评论
电梯直达
正序浏览
edwardvsnc
发表于 2013-10-16 13:39:25
1.会有自己的输出, 不过我不清楚是写到hdfs还是本地dfs上了。
2.会合并
回复
使用道具
举报
显身卡
edwardvsnc
发表于 2013-10-16 13:40:02
每个reduce输出一个结果文件,有多少reduce就会有多少输出文件,然后会有一些其他文件。不会合并的,导出的时候可以用命令行进行合并
回复
使用道具
举报
显身卡
soony_007
发表于 2013-10-16 13:40:50
引用 2 楼 zuochanxiaoheshang 的回复:
每个reduce输出一个结果文件,有多少reduce就会有多少输出文件,然后会有一些其他文件。不会合并的,导出的时候可以用命令行进行合并
不过,我记得reducer会merge输出的结果 , 你的意思是不是merge时,只是merge hdfs上的数据,
各个machine上的输出文件不会merge ?
回复
使用道具
举报
显身卡
jixianqiuxue
发表于 2013-10-16 13:41:20
hadoop fs -getmerge将数据导出时可以将结果文件合并成一个
回复
使用道具
举报
显身卡
edwardvsnc
发表于 2013-10-16 13:42:15
引用 4 楼 zuochanxiaoheshang 的回复:
hadoop fs -getmerge将数据导出时可以将结果文件合并成一个
也就是会自己以part000x文件形式存放在HDFS,不能让其自动合并,默认不合并?
回复
使用道具
举报
显身卡
edwardvsnc
发表于 2013-10-16 13:42:49
不仅默认不会合并而且你不可以设置让它输出一个文件,除非你只设定一个reduce,如果你的数据量很小的话可以这样设定。但是通常情况下你可以你可以启动另一个MR来合并,第一次MR产生多个文件,第二个MR设定一个REDUCE只是简单的合并不做任何数据处理,通常也会很快
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
soony_007
新手上路
关注
2
主题
5
帖子
3
粉丝
TA的主题
关于MapReduce中多个reduce输出的问题
2013-10-16
24小时热文
用友主数据解决方案
数据质量评测方法与指标体系
基于“用户画像”挖掘的精准营销细分模型研
网易用户画像
大数据面试题
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈