搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据学习
›
介绍解说
›
Mongo-Hadoop介绍及相关代码下载
0
0
1
分享
Mongo-Hadoop介绍及相关代码下载
hyj
2014-2-12 16:56:41
发表于
介绍解说
[显示全部楼层]
阅读模式
关闭右栏
0
7135
About云VIP帮助找工作和提升
本帖最后由 hyj 于 2014-2-12 17:00 编辑
可以带着下面问题来阅读本文章:
1.Mongo-Hadoop支持什么nosql数据库?
2.Mongo-Hadoop支持什么开发语言?
3.Mongo-Hadoop的工作流都包含什么?
Hadoop擅长分析和处理大型数据集,而MongoDB擅长存储应用程序的大型数据集,这两者结合到一起,就诞生了Mongo-Hadoop——MongoDB主要负责存储和查询,Hadoop主要负责批处理。
项目地址:
https://github.com/mongodb/mongo-hadoop
Mongo-Hadoop可以很容易地使用Mongo数据库库以及.bson格式的mongoDB备份文件,并将此作为Hadoop Map/Reduce任务的数据输入源或者输出目标。Mongo-Hadoop先检测数据并计算数据分割,然后交给Hadoop并行处理,这样非常大的数据集就可以快速被处理。
Mongo-Hadoop支持Pig和Hive,这两个开源项目允许编写非常简单的脚本来执行非常复杂的MapReduce工作流。
Mongo-Hadoop还支持Hadoop streaming,这样你可以使用Java以及其他任何编程语言来编写map/reduce函数。目前Mongo-Hadoop支持Ruby、Node.js和Python中的streaming。
Mongo-Hadoop的工作流程如下:
Mongo-Hadoop首先检查MongoDB Collection,并计算数据分割
每个分割部分被分配到Hadoop集群中的一个节点
同时,Hadoop节点从MongoDB(或BSON)获取数据,并进行本地处理
Hadoop合并结果,并输出到MongoDB或BSON
------------------------------------------------------------------------------------------------------------------------------------------------
下载地址:
core
pig support
hive support
streaming
mongo-hadoop-core-1.0.0.rar
(31.77 KB, 下载次数: 6)
2014-2-12 16:59 上传
点击文件名下载附件
mongo-hadoop-core-1.0.0-sources.rar
(28.4 KB, 下载次数: 6)
2014-2-12 16:59 上传
点击文件名下载附件
来自群组:
Hadoop技术组
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
没找到任何评论,期待你打破沉寂
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
hyj
超级版主
关注
1689
主题
2216
帖子
468
粉丝
TA的主题
ChatGPT上线了IOS app,很给力
2023-5-19
About云2023年05月19日每日一读
2023-5-19
数澜科技数据中台项目规范-V1.0.0
2023-5-18
现代数据架构
2023-5-18
12 个真正重要的数据质量指标
2023-5-18
24小时热文
gRPC与云原生应用开发:以Go和Java为例
数据库系统工程师教程(第4版)
想来字节技术实习,看我这篇就够了!——保
这些人是如何度过40岁职场危机的
华为:HBase常见问题维护手册V1.0
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈