搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
HDFS
›
hadoop archive ?
0
3
0
分享
hadoop archive ?
top_gloria
发表于 2013-10-25 10:42:49
[显示全部楼层]
阅读模式
关闭右栏
3
5993
About云VIP帮助找工作和提升
hadoop archive 相关的资料有不少,可没有一个详细介绍 arichive 是怎么运作的。生成.HAR文件后是按照HDFS原来的方法分割存储吗吗?
能不能把arichive详细的读写过程介绍一下吗?
谢谢各位大虾们了!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
yaojiank
发表于 2013-10-25 10:42:49
唉!自己的自己答下吧。刚学的不对请更正。
archive是一种特别的归档文件格式,在HDFS的基础上把小文件打包成为一个扩展名为.har的归档文件。
.har文件由metadata(_index & _masterindex)和data part(part-*)两部分组成。
下面是猜测:
把_index & _masterindex 存储在namenode的内存里,data part部分复制成3个副本存到datanode里。
回复
使用道具
举报
显身卡
bob007
发表于 2013-10-25 10:42:49
不支持压缩,感觉就是打个包,碰到文件琐碎的情况,还是不能提高速度。
回复
使用道具
举报
显身卡
jooli
发表于 2013-10-25 10:42:49
har主要是用来压缩inode占用量的,将海量的小文件合成一个大文件。_index&&_masterindex是两个索引文件存储在hdfs上的,副本数为10,加强副本的可靠性。
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
数据湖
Java语言
大数据资源
程序员修炼区
发表新帖
top_gloria
中级会员
关注
49
主题
116
帖子
3
粉丝
TA的主题
cocos2d-x v2.2 移植WP8详解
2013-12-16
Data-Intensive Text Processing with MapReduce下载
2013-10-26
单源最短路径MapReduce实现问题帖
2013-10-26
求高手教一个MapReduce程序的难题,数据少的时候结果没错,数据多结果就错了
2013-10-26
namenode 自动转换为 datanode
2013-10-25
24小时热文
字节跳动精选面经合集
2024年了,互联网大厂福利还香吗?
数据库系统工程师教程(第4版)
高德地图大模型开发年薪百万,落地大模型自
慈不掌兵,我被下属反向PUA了
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈