搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
疑问解答
›
请问在写mapreduce时,如何将两个文件合并
0
4
0
分享
请问在写mapreduce时,如何将两个文件合并
NEOGX
2014-6-26 21:55:55
发表于
疑问解答
[显示全部楼层]
阅读模式
关闭右栏
4
25320
About云VIP帮助找工作和提升
请问在写mapreduce时,如何将两个文件合并,其中a文件中有字段name ip tel ,b文件中有字段name age address。将两个文件中相同姓名的不同字段合并成一个大文件
欢迎加入about云群371358502、39327136,云计算爱好者群
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(4)人评论
电梯直达
正序浏览
hyj
发表于 2014-6-26 21:56:41
name为key
其他字段为value
就可以了
回复
使用道具
举报
显身卡
NEOGX
发表于 2014-6-26 21:57:38
这种方式不知道在reduce中怎么将这些字段合并
在reduce中怎么判断name是否相同,因为一次reduce只可以获取一条记录,无法进行两条记录比较
回复
使用道具
举报
显身卡
hyj
发表于 2014-6-26 21:59:55
本帖最后由 hyj 于 2014-6-26 22:56 编辑
map会分别解析
name1 ip1 tel1 = > key 为name1 value为ip1 tel1
name1 age1 address1 = > key 为name1 value为age1 address1
reduce输入为
name1 [ip1 tel1; age1 address1]
map的时候,key一样的
reduce的时候,拿到的是个list
同一个名字会被自动统计。
可以看看wordcount,如果单词相同,则被统计一次原理是相同的
回复
使用道具
举报
显身卡
我也是猫啦啦啦
发表于 2017-8-20 02:14:54
楼主想问的是怎么把两个文件join到一起吧。。。重点是如何在一个mapreduce输入两个文件
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
NEOGX
高级会员
关注
67
主题
410
帖子
8
粉丝
TA的主题
spark之什么窄依赖、宽依赖
2018-5-24
Keras快速上手:基于Python的深度学习实战
2018-5-24
收集所有区块链(BlockChain)技术开发相关资料,包括Fabric和Ethereum开发资料
2018-4-3
20+深度学习论文集合
2018-4-3
语音识别开源项目汇总
2018-1-19
24小时热文
2024年求职攻略:掌握这4个习惯,迅速斩获
代码精进之路:从码农到工匠
eclipse搭建hadoop-3.1.2所需插件
2023年2月名企最新内推
数据库系统工程师教程(第4版)
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈