搜索
搜 索
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
›
日志
发布
日志
上传
相册
添加
分享
记录
日志
好友的日志
我的日志
随便看看
发表新日志
mapreduce
|
hive
|
hbase和mysq整合
|
hbase
|
集群维护
|
分享
MapReuce 怎么实现去掉文件重复的内容
zhanggl
2014-7-9 20:33
文件数据格式: Name,CardNo,Descriot,CtfTp,CtfId,Gender,Birthday,Address 彬,,,ID,xxxxx21059,M,20101001,,,F,,CHN,,,,,,,,139,19:46:02,4000000 珊,,,ID,xxxxx811090189,M,20101001,,,F,,CHN,,,,,,,,158 世,,,ID,4xxxxx1772,M,19880129,,,F,,CHN,,,,,,,,152108,2,1,,,,,0,2010-10-19 超,,,ID,4xxxxx1772, ...
个人分类:
mapreduce
|
979 次阅读
|
2
个评论
热度
1
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈