分享

about云每日一读汇总(第五篇2015.01.01)

本帖最后由 pig2 于 2015-1-31 00:32 编辑

about云每日一读汇总(第一篇)


about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)



about云2015年01月31日每日一读

每天进步一点点


程序员的技能知识体系真的只能维持五年吗
http://www.aboutyun.com/thread-11466-1-1.html

浅析数据化设计思维在阿里系产品的应用
http://www.aboutyun.com/thread-11462-1-1.html
1、数据在项目中的作用有哪些?
2、数据挖掘中,谁才是最重要的?

3、如何利用数据做日常监控?

openstack【juno】入门 【glance 篇】十:glance初步介绍
http://www.aboutyun.com/thread-11455-1-1.html
1.glance包含哪些组件?
2.glance-api、glance-registry有什么区别?
3.图像文件存储库支持哪些格式?


openstack【juno】入门 【glance 篇】十一:glance安装配置
http://www.aboutyun.com/thread-11458-1-1.html
1.如何创建glance用户?
2.安装glance,需要做哪些准备?
3.如何验证glance数据库同步成功?
4.修改配置文件的过程中,有哪些需要注意的地方?
5.nano编辑器如何使用?


openstack【juno】入门 【glance 篇】十二:glance安装配置验证及相关操作
http://www.aboutyun.com/thread-11460-1-1.html

Docker到底影响了什么?
http://www.aboutyun.com/thread-11461-1-1.html
1、docker与我们哪些应用息息相关?
2、docker对DevOps的影响有哪些?
3、如何看待docker有哪些不足?



ML Pipelines:Spark 1.2中一个用于MLlib的High-Level API
http://www.aboutyun.com/thread-11463-1-1.html
1、什么是High-Level API?
2、如何查看更多SchemaRDD特性?
3、如何理解ML算法?


spark的外排:AppendOnlyMap与ExternalAppendOnlyMap
http://www.aboutyun.com/thread-11464-1-1.html
1、什么是AppendOnlyMap?
2、如何理解spark的外排?

3、如何实现外排?





问答:

搭建环境在配置网络时遇到疑问,有关eth0与eth1
http://www.aboutyun.com/thread-11456-1-1.html

项目组hadoop实战之归一化:每天更新中
http://www.aboutyun.com/thread-11457-1-1.html






about云2015年01月30日每日一读

每天进步一点点


solr空间索引原理及源码分析
http://www.aboutyun.com/thread-11448-1-1.html
1、如何理解solr空间索引?
2、你是如何使用solr索引的?
3、如何分析solr源码?



让年轻程序员少走弯路的14个忠告
http://www.aboutyun.com/thread-11447-1-1.html


OpenStack企业云平台监控实践
http://www.aboutyun.com/thread-11446-1-1.html
1、OpenStack企业云平台监控有哪些方案?
2、如何有效进行日志分析?

3、你是如何实施监控的?


展望2015:数据中心行业的十大预测
http://www.aboutyun.com/thread-11445-1-1.html
1、展望2015,数据中心行业会有哪些预测?
2、你如何看待2015相关技术的发展?
3、2015年,你准备好了吗?


Hadoop log4j日志配置介绍
http://www.aboutyun.com/thread-11444-1-1.html
1.自定义修改hadoop/conf/log4j.properties,需要添加哪些内容?
2.需要修改那个类?
3.修改后,如何生效?

windows7+eclipse+hadoop2.5.2环境配置
http://www.aboutyun.com/thread-11450-1-1.html
1.本文是如何编译eclipse插件?
2.如何创建mapreduce项目?


资源:

NoSQL数据库-CAP-BASE-最终一致性
http://www.aboutyun.com/thread-11451-1-1.html

[HiC2011]大云NoSQL系统设计思考【22页】
http://www.aboutyun.com/thread-11452-1-1.html

问答:

Mac Maven 环境下 hadoop job 执行时抛出 ExitCodeException exitCode=1: chmod:
http://www.aboutyun.com/thread-11437-1-1.html

hbase shell查询 或者用Java api查询 怎么能按时间戳排序,这样可以查到最早存入
http://www.aboutyun.com/thread-11440-1-1.html

Hadoop 配置Log4J只生成文件,没有内容
http://www.aboutyun.com/thread-11441-1-1.html

如何使用MapReduce来完成归一化
http://www.aboutyun.com/thread-11442-1-1.html

请教一个问题,关于mapreduce的shuffle过程
http://www.aboutyun.com/thread-11443-1-1.html


1、shell脚本解决hadoop2+zookeeper+hbase集群start
http://www.aboutyun.com/thread-11435-1-1.html

2、shell脚本解决hadoop2+zookeeper+hbase集群stop
http://www.aboutyun.com/thread-11436-1-1.html


HadoopIPC包源码分析
http://www.aboutyun.com/thread-11449-1-1.html





about云2015年01月29日每日一读

每天进步一点点


拍案而起,十问大数据
http://www.aboutyun.com/thread-11429-1-1.html
1、你如何看待大数据?
2、大数据和云计算、物联网是什么关系?
3、后大数据时代的技术趋势是什么?



openstack【juno】入门 【keystone篇】六::Keystone使用及遇到问题解决办法
http://www.aboutyun.com/thread-11420-1-1.html
1.keystone的ADMIN_TOKEN该如何填写?
2.如何查看keystone数据库?
3.同步数据库遇到问题,可能有哪些原因?
4.keystone创建demo租户,是否还需要创建user及role?


openstack【juno】入门 【keystone篇】七:创建 service entity 和 API endpoint
http://www.aboutyun.com/thread-11424-1-1.html
1.如何查看创建的服务?
2.通过哪个命令可以删除服务?
3.看图API endpoints中包含了哪些?


openstack【juno】入门 【keystone篇】八:新手操作篇(验证操作篇)
http://www.aboutyun.com/thread-11425-1-1.html
1.openstack的环境变量的作用是什么?
2.openstack不配置环境变量如何执行命令?
3.非管理员租户是否具有查看user的权限?

openstack【juno】入门 【keystone篇】九:创建openstack客户端环境变量脚本
http://www.aboutyun.com/thread-11430-1-1.html
1.环境变量一般为什么格式?
2.不同用户环境变量端口是否一致?
3.openstack环境变量都需要配置哪些信息?
4.如何才能保证配置信息生效?


OpenStack云第四天
http://www.aboutyun.com/thread-11410-1-1.html
1.如何确定Image Service是否安装成功?
2.KVM和Xen是如何运行的?


OpenStack云第五天
http://www.aboutyun.com/thread-11423-1-1.html
1.OpenStack对象存储需要工作在什么文件系统上?
2.代理服务器都承担了哪些工作?

hadoop rpc客户端初始化和调用过程详解
http://www.aboutyun.com/thread-11421-1-1.html

hadoop rpc服务端初始化和调用过程详解
http://www.aboutyun.com/thread-11422-1-1.html


openstack 快照分析
http://www.aboutyun.com/thread-11426-1-1.html
1、什么是snapshot?
2、OpenStack如何进行snapshot?
3、OpenStack快照涉及哪些技术?

如何针对不同的数据需求构建OpenStack存储云
http://www.aboutyun.com/thread-11427-1-1.html
1、OpenStack存储有哪些主流技术支持?
2、你如何看待OpenStack的备份?
3、如何提供一种整合的解决方案来保护OpenStack环境中的数据?



Docker源码分析(七):Docker Container网络 (上)
http://www.aboutyun.com/thread-11428-1-1.html
1、docker网络有哪些模式?
2、docker的强大功能实现,基于了哪些Linux内核技术?
3、什么是none模式?



Spark中文手册-编程指南
http://www.aboutyun.com/thread-11413-1-1.html
1.Spark 如何访问集群?
2.有哪几种方式创建 RDDs?

云IDE成云应用开发融入云利器?
http://www.aboutyun.com/thread-11411-1-1.html




about云2015年01月28日每日一读

每天进步一点点

让你真正明白Linux NTP(包括历史、参数解释、安装配置)
http://www.aboutyun.com/thread-11395-1-1.html
1.如何查看ntp是否配置成功?
2.如何了解ntp列出的参数的含义?
3.restrict关键字的作用是什么?


Spark中文手册-快速上手
http://www.aboutyun.com/thread-11409-1-1.html
1、Spark如何快速上手?
2、如何运行你的Spark 应用程序?
3、学习Spark,你有怎样的见解?



openstack juno版安装1: Ubuntu14.04远程连接(ssh安装)
http://www.aboutyun.com/thread-11401-1-1.html
ubuntu14.04 ssh如何安装?
扩展:
1. Ubuntu14.04与ubuntu12.04 ssh有什么区别?
2.远程连接,为什么安装ssh


openstack juno安装2:NTP安装
http://www.aboutyun.com/thread-11397-1-1.html
1.如何查看ntp是否配置成功?
2.如何了解ntp列出的参数的含义?
3.restrict关键字的作用是什么?

openstack juno安装3:mysql(MariaDB)安装及遇到问题解决办法
http://www.aboutyun.com/thread-11399-1-1.html
1.MariaDB与mysql的关系是什么?
2.遇到Checking for corrupt, not cleanly closed and upgrade needing tables.该如何解决?

openstack juno安装4:RabbitMQ 安装
http://www.aboutyun.com/thread-11403-1-1.html

openstack juno(ubuntu14.04)安装5:Keystone部署及介绍
http://www.aboutyun.com/thread-11404-1-1.html
1.如何让keystone数据库,任何客户端都能访问,包括本地?
2.如何配置keystone?

openstack外篇之认识mysql授权及一些操作
http://www.aboutyun.com/thread-11405-1-1.html
1.对于创建的数据库,如何允许本地访问?
2.对于创建的数据库,如何实现远程访问?
3.mysql中%表示的含义是什么?

扩展你的云 ——详解 Nova 中的 Region, Cell, Availability Zone, Host Aggregate
http://www.aboutyun.com/thread-11406-1-1.html
1、怎样扩展你的云?
2、如何设置 flavor 属性?
3、什么是Cell?


Keystone 高可靠性部署与性能测试
http://www.aboutyun.com/thread-11407-1-1.html
1、如何理解Keystone 高可靠性?
2、怎样实现Keystone 高可靠性?
3、Keystone 高可靠性有哪些重要概念?

idea上运行local的spark sql hive
http://www.aboutyun.com/thread-11408-1-1.html
1、idea上运行local的spark sql hive流程是怎样的?
2、如何安装配置安装 remote metastore?
3、如何解决org.apache.spark的问题?



云IDE成云应用开发融入云利器?
http://www.aboutyun.com/thread-11411-1-1.html
1.如何理解云IDE?云IDE是干什么的?
2.云IDE的前景怎么样?

原创OpenStack icehouse版安装教程,详细!
http://www.aboutyun.com/thread-11402-1-1.html


资源:

移动互联网行业概况介绍
http://www.aboutyun.com/thread-11414-1-1.html
大数据小算法:用户行为研究方法(25页面)
http://www.aboutyun.com/thread-11415-1-1.html
机器学习:斯坦福ML公开课笔记
http://www.aboutyun.com/thread-11416-1-1.html
spark源码分析(39页)
http://www.aboutyun.com/thread-11417-1-1.html

问答:

日志管理分析系统架构设计求助!!
http://www.aboutyun.com/thread-11396-1-1.html

hadoop2.x版本下,chukwa支持吗?
http://www.aboutyun.com/thread-11398-1-1.html

请问下新的api怎么处理skip mode跳过坏记录
http://www.aboutyun.com/thread-11400-1-1.html





about云2015年01月27日每日一读

每天进步一点点

如何实现同一OpenStack集群同时支持多种虚拟化技术
http://www.aboutyun.com/thread-11389-1-1.html
1、什么是Mutil-Hypervisor?
2、如何配置Openstack Mutil-Hypervisor 环境?
3、如何在Esxi node上创建VM?


公司的大数据业务为什么都基于Hadoop方案
http://www.aboutyun.com/thread-11388-1-1.html
1、企业选择Hadoop的原因是什么?
2、为什么可以降低成本?
3、你如何看待Hadoop的应用?

一个基于大数据的精准邮件营销的案例
http://www.aboutyun.com/thread-11378-1-1.html
1.什么是邮件营销?
2.京东邮件精准营销为什么会成功?



openstack juno版安装必备: Ubuntu14.04远程连接(ssh安装)
http://www.aboutyun.com/thread-11376-1-1.html
ubuntu14.04 ssh如何安装?
扩展:
1. Ubuntu14.04与ubuntu12.04 ssh有什么区别?
2.远程连接,为什么安装ssh

斯坦福ML公开课笔记14——主成分分析
http://www.aboutyun.com/thread-11380-1-1.html
1.PCA解决的是什么问题?
2.怎么定义PCA模型?

斯坦福ML公开课笔记15—隐含语义索引、奇异值分解、独立成分分析
http://www.aboutyun.com/thread-11379-1-1.html
1.隐含语义索引是一种什么方式?
2.怎么理解鸡尾酒宴会问题?


Hadoop的辉煌还能延续多久?
http://www.aboutyun.com/thread-11386-1-1.html

Openstack 性能测试 Rally
http://www.aboutyun.com/thread-11391-1-1.html
1、什么是Rally?
2、如何进行测试?


问答:

一个问题,困扰一个星期了,请达人解答
http://www.aboutyun.com/thread-11377-1-1.html

在win7下用eclipse运行hadoop的问题
http://www.aboutyun.com/thread-11381-1-1.html

求助:在Eclipse下运行MapReduce,只运行了Map函数Reduce函数不能执行
http://www.aboutyun.com/thread-11390-1-1.html





about云2015年01月26日每日一读

每天进步一点点

Flume(NG)架构设计要点及配置实践
http://www.aboutyun.com/thread-11362-1-1.html
1、什么是Flume NG?
2、如何理解Flume的架构核心概念?
3、如何配置Agent?

HDFS读文件过程分析:获取文件对应的Block列表
http://www.aboutyun.com/thread-11363-1-1.html
1、如何理解HDFS读文件过程?
2、怎样对Block列表进行排序?
3、如何创建FSDataInputStream流对象?

人工智能、机器智能技术详解
http://www.aboutyun.com/thread-11364-1-1.html
1、人工智能现在发展如何?
2、商业模式有哪些?
3、人工智能会对人类社会产生哪些影响?

解读云计算的8项核心技术
http://www.aboutyun.com/thread-11367-1-1.html
1、你是如何理解云计算的?
2、云计算有哪些核心技术?
3、如何让云计算更绿色?



资源:
使用Fuel安装OpenStack juno安装OpenStack
http://www.aboutyun.com/thread-11370-1-1.html

史上最详细的大数据安装文档(零基础hadoop)
http://www.aboutyun.com/thread-11371-1-1.html

cloudstack4.4.2+xenserver6.2简单网络部署视频及资料
http://www.aboutyun.com/thread-11372-1-1.html

Apache Pig入门不错学习文档
http://www.aboutyun.com/thread-11373-1-1.html



问答:

hadoop安装问题
http://www.aboutyun.com/thread-11368-1-1.html



about云2015年01月25日每日一读

每天进步一点点

双倍提升Apache Spark排序性能
http://www.aboutyun.com/thread-11359-1-1.html
1.spark shuffle都有哪些操作?
2.本文spark shuffle分为哪两组任务?
3.从1.1版本开始,Spark引入了“sort-based shuffle”实现原因是什么?


大数据智能分析:外滩踩踏事故背后
http://www.aboutyun.com/thread-11355-1-1.html
1、如何理解大数据智能分析的应用?
2、如何使用大数据智能分析来建设智慧城市?
3、你如何理解大数据智能分析与我们的生活?

大数据时代引发安全问题,应增强身份管理
http://www.aboutyun.com/thread-11352-1-1.html
1、什么是SSH通信安全?
2、如何保障大数据安全?
3、如何运用M2M身份管理?


Yarn简单介绍及内存配置
http://www.aboutyun.com/thread-11353-1-1.html
1、Yarn对MRv1的改进有哪些?
2、怎样对Yarn简单的内存配置?
3、如何理解Yarn的资源抽象container?



Hadoop YARN常见问题以及解决方案
http://www.aboutyun.com/thread-11354-1-1.html
1、Hadoop YARN常见问题有哪些?
2、你是如何解决这些问题的?



问答:

nova network-create 使用这个命令创建时提示error
http://www.aboutyun.com/thread-11356-1-1.html

资源:

nova network三种网络模式介绍
http://www.aboutyun.com/thread-11357-1-1.html






about云2015年01月24日每日一读

每天进步一点点

美团推荐算法实践
http://www.aboutyun.com/thread-11350-1-1.html
1、什么是推荐系统?
2、如何理解子策略融合?

3、simrank的计算使用什么方式?


深入浅出数据仓库中SQL性能优化之Hive篇
http://www.aboutyun.com/thread-11349-1-1.html
1、如何理解数据仓库中SQL之Hive整体优化?
2、怎样对Job整体优化?
3、如何减少Job数?


Hadoop上的中文分词与词频统计实践
http://www.aboutyun.com/thread-11344-1-1.html
1.本文使用的是什么框架?
2.IKAnalyzer与中文分词方法有什么不同?



一个分布式服务器集群架构方案
http://www.aboutyun.com/thread-11340-1-1.html
1.分布式和集群是如何提升效率的?
2.HAProxy有哪些优点?



OpenStack云第二天
http://www.aboutyun.com/thread-11339-1-1.html
1.OpenStack目前支持哪些平台?
2.对于对象存储,所有的文件如何展现?

基于Redis+Srcache_nginx服务器缓存
http://www.aboutyun.com/thread-11343-1-1.html
1.redis处理服务器缓存有什么优点?
2.Web应用层缓存如何起作用?



在2015年,我们会看到SaaS怎样的转变?
http://www.aboutyun.com/thread-11347-1-1.html
1、SaaS的发展趋势轨迹会是什么?
2、SaaS会有哪五大发展趋势?
3、SaaS有哪些技术?

备份基于Docker的PostgreSQL数据库
http://www.aboutyun.com/thread-11348-1-1.html
1、怎样备份基于Docker的PostgreSQL数据库?
2、如何直接在PostgreSQL的容器中制作包含pg_dump容器?
3、你是如何使用Docker的?



问答:

NameNode is still loading. Redirecting to the Startup Progress page
http://www.aboutyun.com/thread-11338-1-1.html

关于分布式文件系统抽象块好处的疑问
http://www.aboutyun.com/thread-11341-1-1.html

Openstack 网络问题
http://www.aboutyun.com/thread-11342-1-1.html

hive 运行select count(*) from xx 出错
http://www.aboutyun.com/thread-11345-1-1.html

问:hdfs中可以存在隐藏文件吗?
http://www.aboutyun.com/thread-11346-1-1.html




about云2015年01月23日每日一读

每天进步一点点

准确测量机器学习模型的误差
http://www.aboutyun.com/thread-11335-1-1.html
1、如何看待误差测量?
2、如何理解测试集?
3、随机森林与人工神经网络等模型均无法应用哪些方法?



在HDInsight中开始使用Hadoop与Hive来分析移动手机使用
http://www.aboutyun.com/thread-11332-1-1.html
1、如何分析移动手机使用?
2、怎样在HDInsight中使用Hadoop与Hive?
3、如何在门户网站运行简单实例?

Openstack cinder初学入门命令
http://www.aboutyun.com/thread-11321-1-1.html
1.如何使用cinder帮助命令?
2.如何查看用户的所有资源?
3. cinder credentials命令的作用是什么?

windows 下编译及使用flume
http://www.aboutyun.com/thread-11328-1-1.html
1.编译flume需要哪些步骤?
2.flume如何在window下使用?

数据建模相关介绍
http://www.aboutyun.com/thread-11330-1-1.html

拿下国家自然科学奖的“透明计算”是什么?
http://www.aboutyun.com/thread-11331-1-1.html
1、什么是透明计算?
2、透明计算和云计算等有哪些不同?
3、如何看待透明计算的发展?

Docker编排工具Fig介绍
http://www.aboutyun.com/thread-11334-1-1.html
1、什么是编排?
2、如何安装和使用Fig?
3、如何更好的搭建开发环境?


问答:
eclipse上运行简单hadoop2程序出错
http://www.aboutyun.com/thread-11321-1-1.html

求助,在cinder中添加云硬盘超过10G 添加失败
http://www.aboutyun.com/thread-11322-1-1.html

openstack cinder-不能创建云磁盘(时间不同步NTP问题)
http://www.aboutyun.com/thread-11323-1-1.html

windows下使用flume-ng
http://www.aboutyun.com/thread-11326-1-1.html

【求教】Flume+Hive中数据完整性的问题
http://www.aboutyun.com/thread-11327-1-1.html

修改Cinder的Volume配额
http://www.aboutyun.com/thread-11329-1-1.html

stanford segmenter中文分词怎么支持为分布式
http://www.aboutyun.com/thread-11333-1-1.html






about云2015年01月22日每日一读

每天进步一点点



Hadoop 2.0 上深度学习的解决方案
http://www.aboutyun.com/thread-11309-1-1.html
1.什么是深度信任网络?
2.如何理解DBN层次?

Big data is better data
http://www.aboutyun.com/thread-11310-1-1.html
1.你如何理解大数据这个概念?
2.坐姿数据有何开发意义?


OpenStack云第一天
http://www.aboutyun.com/thread-11311-1-1.html
1.openstack哪个节点提供与管理网络虚拟机实例?
2.OpenStack有什么运用价值?

成为优秀高级程序员的10个要点
http://www.aboutyun.com/thread-11312-1-1.html
1.软件工程师的职业生涯要历经几个阶段?
2.作者觉得重构有何重要意义?


Spark技术解析及其在百度最大单集群1300台的应用实践
http://www.aboutyun.com/thread-11317-1-1.html
1、如何理解Spark技术的运用?
2、百度开放云BMR有哪些技术运用?
3、如何看待Enhanced in-memory columnar storage?

Spark技术解析及其在百度最大单集群1300台的应用实践2
http://www.aboutyun.com/thread-11318-1-1.html
1、Spark技术有哪些热点?
2、如何更好的使用Tachyon?
3、Tachyon在百度实践中遭遇的挑战有哪些?




百度开发超级计算机 用于深度学习算法研究
http://www.aboutyun.com/thread-11315-1-1.html
1、如何进行深度学习算法?
2、如何将超级计算机用于深度学习算法研究?

神经网络简史
http://www.aboutyun.com/thread-11316-1-1.html
1、如何看待深度学习?
2、神经网络历经了哪些发展?
3、深度学习发展趋势如何?


问答:

ceilometer中 /etc/ceilometer/sources.json
http://www.aboutyun.com/thread-11313-1-1.html

hadoop2.6的datanode不能启动,请帮助
http://www.aboutyun.com/thread-11314-1-1.html

怎样将云桌面上的文件下载到本地
http://www.aboutyun.com/thread-11319-1-1.html






about云2015年01月21日每日一读

每天进步一点点




Java及Web程序调用hadoop2.6
http://www.aboutyun.com/thread-11307-1-1.html
1、配置过程中会遇到哪些问题,如何解决?
2、Java调用Hadoop2.6 ,运行MR程序需要做哪些配置?
3、如何通过Web程序调用Hadoop?



OpenvSwitch概念和原理
http://www.aboutyun.com/thread-11304-1-1.html
1、什么是OpenvSwitch?
2、OVS的主要作用是什么?
3、OpenvSwitch的组成部分有哪些?

淘宝联合新浪微博:大数据挖掘继续改善
http://www.aboutyun.com/thread-11303-1-1.html
1、如何利用淘宝资源做广告?
2、新浪微博利用淘宝资源做广告,失误在哪里?
3、大数据挖掘有哪些值得继续改善?

年轻程序员最需要学什么?自律!
http://www.aboutyun.com/thread-11301-1-1.html
1.文章中的自律具体体现在什么地方?
2.你觉得年轻程序员最需要学什么?




大数据入行新手如何进行机器学习
http://www.aboutyun.com/thread-11300-1-1.html
1.为什么说机器学习是简单数据检索与存储的合理扩展?
2.Apache Mahout项目的目的是什么?




亿级用户下的新浪微博平台架构
http://www.aboutyun.com/thread-11298-1-1.html
1.微博平台的第三代技术体系是怎样的?
2.微博平台在服务层使用最为广泛的两个框架是什么?


在Ubuntu上部署CloudFoundry Server指导
http://www.aboutyun.com/thread-11297-1-1.html
1.从源码安装会遇到什么问题?
2.如何通过PPA源安装?
3.本文提供了几种安装方式?



Docker网络详解及pipework源码解读与实践
http://www.aboutyun.com/thread-11299-1-1.html
1.Docker的4种网络模式分别是什么?
2.如何将Docker容器配置到本地网络环境中?


Spark初探
http://www.aboutyun.com/thread-11306-1-1.html
1、如何看待Spark生态系统?
2、为什么比MapReduce快呢?
3、如何走进弹性分布式数据集RDD?




问答

我在笔记本上安装了虚拟机 虚拟机装了Ubuntu系统 如何安装cf
http://www.aboutyun.com/thread-11294-1-1.html

hadoop2.6.0作业恢复问题
http://www.aboutyun.com/thread-11295-1-1.html


Mahout 协同过滤算法
http://www.aboutyun.com/thread-11296-1-1.html

【求助】keystone的用户、租户、角色的疑问
http://www.aboutyun.com/thread-11305-1-1.html











about云2015年01月20日每日一读

每天进步一点点

程序员为什么值得写博客
http://www.aboutyun.com/thread-11287-1-1.html
1、你写过博客么?
2、你觉得程序员为什么值得写博客?
3、写博客,需要一种什么精神?


Quora 问答:不懂算法却善于开发,如何去大公司工作呢?
http://www.aboutyun.com/thread-11285-1-1.html
1.你怎么看“行为艺术”般的面试题?
2.自我反省,你是否能有逻辑思维技巧去学习新的技术,去理解它们,并像曾经开发iOS和安卓应用那样的去制作漂亮的应用呢?


英国数据分析师讲故事:我是如何走上数据分析之路的?
http://www.aboutyun.com/thread-11284-1-1.html
1.什么是定量分析?
2.什么是SAS Enterprise Miner?


机器学习和计算机视觉相关的数学
http://www.aboutyun.com/thread-11282-1-1.html
1.最具有代表性的Machine Learning中主流的两大类方法分别是什么?
2.什么是李群?


与数据挖掘有关或有帮助的R包和函数的集合
http://www.aboutyun.com/thread-11283-1-1.html
1.数据挖掘有关或者有帮助的R包有哪些?
2.数据挖掘有关或者有帮助的函数有哪些?

DOCKER源码分析(六):DOCKER DAEMON网络
http://www.aboutyun.com/thread-11289-1-1.html
1、Docker网络主要包含哪些部分?
2、如何理解Docker Daemon网络?
3、createBridge函数实现过程主要步骤有哪些?

Heat Ha介绍
http://www.aboutyun.com/thread-11290-1-1.html
1、什么是Heat Ha ?
2、怎么通过配置模板实现Heat的HA?
3、关于HA,有哪些后续思考?


混合云将是未来必然趋势 五大原因来证明
http://www.aboutyun.com/thread-11291-1-1.html
1、如何看待云技术的发展?
2、云技术的发展会是怎样的趋势?


问答:

急急急!!!菜鸟求助!win7下如何将hadoop源文件成功导入eclispe中
http://www.aboutyun.com/thread-11286-1-1.html

Hadoop-2.6.0在Eclipse中如何安装插件问题
http://www.aboutyun.com/thread-11288-1-1.html

openstack 通讯网络有几种?
http://www.aboutyun.com/thread-11292-1-1.html









about云2015年01月19日每日一读
因网站升级暂时耽搁,后面继续每日一读

每天进步一点点

通过Mahout构建推荐系统--通过IDRescorer扩展评分规则
http://www.aboutyun.com/thread-11279-1-1.html
1.IDRescorer接口规定了哪些个必须实现的方法?
2.如何定义过滤规则?



Ubuntu14 server + Hadoop2.2.0环境下Sqoop1.99.3部署记录
http://www.aboutyun.com/thread-11280-1-1.html
1.如何解决log4j包冲突问题?
2.如何配置sqoop环境变量?


Docker源码分析(五):Docker Server的创建
http://www.aboutyun.com/thread-11278-1-1.html
1、什么是Docker Server?
2、如何添加路由记录?
3、怎样创建listener监听实例?


spark RDD keyvalue操作
http://www.aboutyun.com/thread-11277-1-1.html
1、涉及shuffle的操作有哪些?
2、如何理解combineByKey的操作流程?
3、flatMapValues作用是什么?

Spark Streaming小结
http://www.aboutyun.com/thread-11276-1-1.html
1.Spark Streaming有哪些优势?
2.Discretized Stream在Spark中起到哪些作用?


Docker源码分析(四):Docker Daemon之NewDaemon实现
http://www.aboutyun.com/thread-11274-1-1.html
1、NewDaemon作用是什么?
2、如何理解Docker 的核心实现原理?
3、怎样 创建Docker网络设备?




资源:
数据挖掘概念与技术第二版和第三版(包含课后答案)【英文】
http://www.aboutyun.com/thread-11275-1-1.html


问答:

Hadoop2.5集群安装成功,运行wordcount出错
http://www.aboutyun.com/thread-11272-1-1.html



about云2015年01月16日每日一读

每天进步一点点



面试过程中经常被问道的问题记录
http://www.aboutyun.com/thread-11242-1-1.html

一个简单的基于内容的推荐算法
http://www.aboutyun.com/thread-11257-1-1.html
1.基于内容的推荐算法原理大本文分了哪三步?
2.什么是“Item”?
3.什么是“Item Profiles”?

Hadoop 2.0 (YARN)中的安全机制介绍
http://www.aboutyun.com/thread-11243-1-1.html
1.本文认为安装机制是有那两部分组成的?
2.Hadoop 2.0中的认证机制采用哪两种方案?

总结数据挖掘预测分类中的样本筛选和特征处理
http://www.aboutyun.com/thread-11238-1-1.html
1.做样本训练前需要哪些准备工作?
2.解决正负样本不平衡问题的手段主要有哪些?

定向展示广告投放中的点击率预估模型简介
http://www.aboutyun.com/thread-11239-1-1.html
1.展示广告的排序公式都有哪些?
2.定向广告预估点击率模型是什么?

HBase随机宕机事件处理 & JVM GC回顾
http://www.aboutyun.com/thread-11240-1-1.html
1.JVM主要内存区域分为哪几部分?
2.Java可配置的垃圾收集器有哪几种类型?


Hadoop安全机制介绍
http://www.aboutyun.com/thread-11244-1-1.html
1.安全认证和安全授权有什么区别?
2.user与Service分别是什么?
3.Hadoop 一直缺乏安全机制主要表现在哪方面?

开发Hive自定义UDF,生成32位字母数字随机串
http://www.aboutyun.com/thread-11245-1-1.html
1.“生成随机串的逻辑只被执行了一遍,所有行的该字段字符串都是一样的,并不会像预想的那样,即每行一个随机串。“遇到此问题该怎么办?
2.如何理解基于自定义UDF类创建自定义函数?

hadoop安全机制汇总
http://www.aboutyun.com/thread-11246-1-1.html

数据挖掘的知识类型
http://www.aboutyun.com/thread-11251-1-1.html
1、什么是关联模式挖掘?
2、数据挖掘中有哪些是非常重要的任务?
3、如何理解偏差检测?

Hive读取不到Flume正在写入的HDFS临时文件的解决办法
http://www.aboutyun.com/thread-11252-1-1.html
1.本文的应用场景是什么?
2.Hive读取不到Flume正在写入的HDFS临时文件,该如何解决?

玩转Docker镜像
http://www.aboutyun.com/thread-11253-1-1.html
1、docker镜像是如何命名的?
2、如何通过设置Registry Mirror克服网络延时?
3、怎样配置Registry Mirror?

OpenStack服务启动故障排除经验
http://www.aboutyun.com/thread-11254-1-1.html
1、如何排除OpenStack服务启动故障?
2、你是如何排除OpenStack故障的?

什么是Memcache及使用Yum安装Memcache
http://www.aboutyun.com/thread-11255-1-1.html
1.什么是memcached
1.使用什么命令验证安装memcached是否成功?
2.如何重启memcached服务?


资源:

hadoop及云计算介绍一套小教程
http://www.aboutyun.com/thread-11256-1-1.html





问答:

【已解决】如何彻底删除openvswitch的一个port?
http://www.aboutyun.com/thread-11236-1-1.html

【求助】关于实时指标的业务实现
http://www.aboutyun.com/thread-11237-1-1.html

【已解决】ssh-keygen密码
http://www.aboutyun.com/thread-11241-1-1.html

求教,HBase中块缓存的作用?
http://www.aboutyun.com/thread-11247-1-1.html

有人解决过flume写hdfs不刷新的问题么?
http://www.aboutyun.com/thread-11250-1-1.html








about云2015年01月15日每日一读

每天进步一点点


技术篇:微博推荐引擎体系结构介绍
http://www.aboutyun.com/thread-11232-1-1.html
1.微博推荐本文分了几层?
2.通用推荐框架(CRF, common recommon framework)的作用是什么?
3.推荐计算层的职责是什么?



微博背后的大数据原理:微博推荐算法简述
http://www.aboutyun.com/thread-11231-1-1.html
1.为什么会产生推荐系统?
2.本文是如何将微博推荐的目标和需要解决的问题,抽样为一系列的数学问题的?
3.如何将微博内容转化为结构化向量,包括词语切分、词语信息标注、内容核心词/实体词提取、语义依存分析等?


微博背后用了哪些算法
http://www.aboutyun.com/thread-11225-1-1.html
1.如何衡量用户之间的相似度呢?
2.用户与好友的兴趣相似度都有哪些标准?
3.微博中用户影响力是如何计算的?

程序员应该关注的一些事儿
http://www.aboutyun.com/thread-11226-1-1.html




搜索推广中的查询词扩展
http://www.aboutyun.com/thread-11221-1-1.html
1.搜索广告一般的做法是怎样的?
2.还有哪些查询扩展的方式?

Python 利用pexpect和paramiko模块进行远程服务器的监控
http://www.aboutyun.com/thread-11219-1-1.html
1.Python怎样实现对远程服务器进行监控?
2.pexpect模块和paramiko模块,如何进行多台远程服务器的监控?


漫谈搜素引擎的排序模型
http://www.aboutyun.com/thread-11217-1-1.html
1.什么是朴素贝叶斯算法原理?
2.Lucene默认的排序算法是怎样的?


从两个例子看 Python【map、reduce、filter】内置函数的使用
http://www.aboutyun.com/thread-11216-1-1.html
1.Map函数怎样输出执行结果?
2.Reduce函数的调用有什么特点?

OpenStack Ceilometer数据存储与API源码解析
http://www.aboutyun.com/thread-11228-1-1.html
1、如何理解MongoDB对Collections的存取?
2、怎样合理的利用和分析采集到的数据?
2、如何进行二次开发?


OpenStack Ceilometer中的Pipeline机制
http://www.aboutyun.com/thread-11229-1-1.html
1、如何定义Pipeline?
2、了解Ceilometer的数据流?
3、Pipeline机制在Ceilometer中的作用是什么?

OpenStack Nova内部机制
http://www.aboutyun.com/thread-11230-1-1.html
1、如何学习Openstack源码?
2、怎样对OpenStack提交贡献?
3、Openstack源码布局和基础架构是怎样的?


【分享】openstack 命令行管理
http://www.aboutyun.com/thread-11215-1-1.html

资源:

Apache Flume Distributed Log Collection for Hadoop(中文版)
http://www.aboutyun.com/thread-11234-1-1.html

阿里、京东、IBM大数据文档
http://www.aboutyun.com/thread-11233-1-1.html

问答:

cinder backup工作原理
http://www.aboutyun.com/thread-11218-1-1.html

如何把Weka集成在Hadoop框架里?
http://www.aboutyun.com/thread-11223-1-1.html

有谁试过用storm直接向HDFS写数据?
http://www.aboutyun.com/thread-11224-1-1.html

【求助】通过Dashboard启动云主机后无法连接
http://www.aboutyun.com/thread-11227-1-1.html







about云2015年01月14日每日一读

每天进步一点点

机器学习、大数据面试问题及答题思路
http://www.aboutyun.com/thread-11213-1-1.html



数据挖掘:Mahout推荐算法编程实践
http://www.aboutyun.com/thread-11212-1-1.html
1.创建好数据模型后,第二步为什么需要指定一种计算“距离”的方法?
2.Mahout推荐算法编程实现包含哪些步骤?


HBase 0.94之后Split策略
http://www.aboutyun.com/thread-11211-1-1.html
1.而在0.94版本之后,默认split策略修改为了什么?
2.这种策略有什么好处?

HBase Memstore配置
http://www.aboutyun.com/thread-11208-1-1.html
1.memstore有哪些好处?
2.memstore是什么以及它如何工作?

Hbase写数据,存数据,读数据的详细过程
http://www.aboutyun.com/thread-11207-1-1.html
1.怎样理解Hbase写数据和存数据的过程?
2.关于版本的控制,如何让多台服务器上的时间都同步?



Hbase WAL原理学习
http://www.aboutyun.com/thread-11206-1-1.html
1.客户端往RegionServer端提交数据的时候,WAL日志起什么作用?
2.WAL的实现类是什么?并且是怎么实现的?


0.98.9版本HBase中存储元数据的表说明
http://www.aboutyun.com/thread-11205-1-1.html



hbase存储结构介绍及hbase各种概念
http://www.aboutyun.com/thread-11204-1-1.html
1.HBase中的存储包含哪些存储概念?
2.HMaster及HRegionServer的作用是什么?


2014年值得关注的十个Hadoop大数据创业公司
http://www.aboutyun.com/thread-11198-1-1.html

值得关注的12大Hadoop厂商
http://www.aboutyun.com/thread-11199-1-1.html



问答:

HBase数据到底是怎么存储的?
http://www.aboutyun.com/thread-11194-1-1.html

新手学docker遇到的几个问题
http://www.aboutyun.com/thread-11195-1-1.html

【已解决】创建subnet迟迟没有响应
http://www.aboutyun.com/thread-11196-1-1.html

请教dashboard的问题
http://www.aboutyun.com/thread-11197-1-1.html

hive补丁文件如何使用
http://www.aboutyun.com/thread-11200-1-1.html

【已解决】创建的云主机存到哪里了?
http://www.aboutyun.com/thread-11201-1-1.html

【已解决】qpidd要装在控制节点?还是各个节点都要装?
http://www.aboutyun.com/thread-11202-1-1.html

【已解决】启动云主机时,No valid host was found.
http://www.aboutyun.com/thread-11203-1-1.html

HFileOutputFormat生成HFile后Region数量问题
http://www.aboutyun.com/thread-11209-1-1.html


【求助】Tenant Virtual Router有一个口是DOWN的
http://www.aboutyun.com/thread-11210-1-1.html






about云2015年01月13日每日一读

每天进步一点点
Flume-ng生产环境实践(一)Flume-ng生产环境编译
http://www.aboutyun.com/thread-11176-1-1.html
1.Flume-ng生产环境如何搭建?
2.flume-ng分布式日志是用来干什么的?


Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据
http://www.aboutyun.com/thread-11177-1-1.html
1.source端单event的body如何处理大于16字节的数据的?
2.具体的方法是如何实现的?


Flume-ng生产环境实践(三)实现文件sink,按照固定格式目录输出
http://www.aboutyun.com/thread-11178-1-1.html
1.文件sink使用时,如何配置?
2.文件sink又有哪些依赖包?


Flume-ng生产环境实践(四)实现log格式化interceptor
http://www.aboutyun.com/thread-11179-1-1.html
1.filesink中数据如何传输?
2.event中header的键值对是怎样起作用的?

hadoop基础:两种SharePoint 身份验证的选择--Kerberos .vs. NTLM
http://www.aboutyun.com/thread-11183-1-1.html
1.什么是NTLM?
2.什么是Kerberos?



SDN的选择:OpenFlow、虚拟机、OpenStack和VXLAN/NVGRE
http://www.aboutyun.com/thread-11187-1-1.html
1、你如何看待当前流行的SDN?
2、VXLAN和NVGRE的两种方案都是为了解决什么问题?
3、OpenFlow有哪些注意事项?

kvm性能优化方案---cpu/内存/磁盘/网络
http://www.aboutyun.com/thread-11188-1-1.html
1、kvm性能优化有哪些内容?
2、网络虚拟化有哪些实现方案?
3、你如何对KVM优化的?

VXLAN学习整理
http://www.aboutyun.com/thread-11189-1-1.html
1、什么是VXLAN?
2、VXLAN网络和非VXLAN网络区别是什么?
3、如何在你的环境中使用VXLAN?

hadoop新手入门必读经典帖子汇总
http://www.aboutyun.com/thread-11191-1-1.html



资源:
hbase的案例、编程、应用场景
http://www.aboutyun.com/thread-11175-1-1.html


问答:

hadoop Kerberos配置问题
http://www.aboutyun.com/thread-11180-1-1.html

hadoop 重新编译,提示如下错误,怎么个意思了?
http://www.aboutyun.com/thread-11181-1-1.html

JobTracker会调用NameNode的方法吗?
http://www.aboutyun.com/thread-11182-1-1.html

请教关于hbase的强一致模型的理解
http://www.aboutyun.com/thread-11184-1-1.html

一道面试题的疑惑
http://www.aboutyun.com/thread-11185-1-1.html






about云2015年01月12日每日一读

每天进步一点点


什么是数据可视化及微博数据的可视化分析
http://www.aboutyun.com/thread-11170-1-1.html
1.微博为什么有可视化现实需要?
2.什么是数据可视化?


大数据:盈利的秘诀
http://www.aboutyun.com/thread-11164-1-1.html
1、如何理解合作机制优化?
2、一个典型的消费者在消费行为路径中会有哪些步骤?
3、社交活动和线上活动适合哪里?


埃博拉病毒——大数据时代的疫情防控
http://www.aboutyun.com/thread-11165-1-1.html
1、如何看待大数据分析的重要性?
2、如何理解数据分析已然成为人类征服自然界和适应自然界的重要力量?
3、如何看待数据分析在埃博拉抗击中的作用?

大数据的未来之路
http://www.aboutyun.com/thread-11166-1-1.html
1、如何看待大数据的未来之路?
2、未来企业数据中心的作用是什么?
2、企业盈利之路,可以有哪些?


漫谈云计算攻击模式
http://www.aboutyun.com/thread-11167-1-1.html
1、如何看待云计算攻击的种类/方法?
2、谈谈自己关于云计算安全的防御之道?

配置Zookeeper Kerberos认证介绍
http://www.aboutyun.com/thread-11168-1-1.html
1.如何生成zookeeper.keytab?
2. zookeeper 配置文件需修改哪些内容?
3.ZooKeeper Client配置 keytab需要哪些步骤?


国家对大数据的重视:国务院副总理汪洋--谈大数据感悟
http://www.aboutyun.com/thread-11169-1-1.html












about云2015年01月11日每日一读

每天进步一点点

总结内容分发平台个性化推荐系统
http://www.aboutyun.com/thread-11162-1-1.html
1.推荐系统架构为什么包含在线和离线部分?
2.在推荐过程中都需要考虑什么问题?



Openstack弹性块存储服务Cinder
http://www.aboutyun.com/thread-11154-1-1.html
1、如何看待Cinder的主要组成组件?
2、如何查看qpid当前活跃的queue?
3、目前Cinder-scheduler支持的filter包括哪些?


如何用OpenStack命令行工具管理虚拟机
http://www.aboutyun.com/thread-11152-1-1.html
1、如何用命令行工具创建虚拟机?
2、如何停止、暂停和清除虚拟机?
3、如何用命令管理VM的生命周期?


Openstack cinder配置iscsi存储专用网络
http://www.aboutyun.com/thread-11150-1-1.html
1、为什么需要配置iscsi的专用网络?
2、如何配置iscsi的专用网络?


Yarn Container计算和MapReduce的内存配置
http://www.aboutyun.com/thread-11149-1-1.html
1.YARN中处理能力的基本单元是什么?
2.什么是保留内存?
3.4到8G Container建议多少M?


给OpenStack创建Windows XP镜像
http://www.aboutyun.com/thread-11155-1-1.html
1、如何创建Windows XP镜像?
2、怎样才能让创建的Windows VM能上网?

Storm-kafka【接口实现】-1 DynamicBrokersReader
http://www.aboutyun.com/thread-11156-1-1.html
1.DynamicBrokersReader的作用是什么?
2.DynamicBrokersReader实现了哪些功能?



资源:

云计算与数据挖掘
http://www.aboutyun.com/thread-11159-1-1.html

云计算--划时代的技术
http://www.aboutyun.com/thread-11160-1-1.html

2014年11月中华架构师大会关于大数据云技术文档分享
http://www.aboutyun.com/thread-11161-1-1.html


问答

关于container内存设置的问题??
http://www.aboutyun.com/thread-11148-1-1.html

安装CDH5,启动yarn服务失败问题
http://www.aboutyun.com/thread-11157-1-1.html









about云2015年01月10日每日一读

每天进步一点点

docker都可以用来干什么--八个Docker的真实应用场景
http://www.aboutyun.com/thread-11138-1-1.html
1.docker在开发工作方面解决了哪些问题?
2.docker在环境隔离方面有哪些应用?
3.Google和Facebook都看重了docker那个特性?


今天去面试的笔试题
http://www.aboutyun.com/thread-11139-1-1.html


遗传算法入门介绍
http://www.aboutyun.com/thread-11133-1-1.html
1.什么是遗传算法?
2.遗传算法思想 是什么?


MapReduce与遗传算法、MapReduce与粒子群算法结合与实现
http://www.aboutyun.com/thread-11132-1-1.html
1.粒子群算法的MapReduce如何通过代码实现?
2.MapReduce如何与遗传算法结合?


GRE、PPTP、L2TP隧道协议
http://www.aboutyun.com/thread-11134-1-1.html
1.什么是GRE?
2.GRE有什么优点和缺点?

Google Kubernetes设计文档之服务篇
http://www.aboutyun.com/thread-11137-1-1.html
1、如何理解Kubernetes中的服务?
2、portals有哪些缺点?
3、portal的未来在哪里?

Nova Baremetal Driver深入分析
http://www.aboutyun.com/thread-11140-1-1.html
1、什么是Nova BareMetal?
2、如何分析baremetal?
3、如何使用BareMetal Driver?


Openstack Keystone LDAP后端配置
http://www.aboutyun.com/thread-11145-1-1.html
1、什么是LDAP?
2、LDAP和keystone结合有什么优势?
3、完全删除LDAP的命令是什么?



资源:
cloudstack 高级网络配置手册
http://www.aboutyun.com/thread-11136-1-1.html


问答:

Hbase的辅助索引问题
http://www.aboutyun.com/thread-11130-1-1.html


Centos6.5+Hive-0.14+mysql5.6搭建中异常信息解决
http://www.aboutyun.com/thread-11131-1-1.html

spark执行任务报错 java.net.ConnectException
http://www.aboutyun.com/thread-11135-1-1.html


storm-kafka 整合项目测试
http://www.aboutyun.com/thread-11141-1-1.html






about云2015年01月09日每日一读

每天进步一点点


spark入门教程及经验总结
http://www.aboutyun.com/thread-11128-1-1.html
1.cluster mode 模式运行包含哪些流程?
2.yarn mode 运行模式有什么特点?
3..在关闭http file server进程时,遇到什么错误?

优酷hadoop,mapred面试题及答案
http://www.aboutyun.com/thread-11107-1-1.html


kafka详解一、Kafka简介
http://www.aboutyun.com/thread-11113-1-1.html
1.Kafka有何特性?
2.Kafka有哪些组件?

Kafka详解二、如何配置Kafka集群
http://www.aboutyun.com/thread-11114-1-1.html
1.Kafka有哪几种配制方法?
2.如何启动一个Consumer实例来消费消息?

kafka详解三:开发Kafka应用
http://www.aboutyun.com/thread-11115-1-1.html
1.Kafka系统由什么组成?
2.Kafka中和producer相关的API是什么?


kafka详解四:Kafka的设计思想、理念
http://www.aboutyun.com/thread-11116-1-1.html
1.Kafka的设计基本思想是什么?
2.Kafka消息转运过程中是如何确保消息的可靠性的?


Kafka详解五、Kafka Consumer的底层API- SimpleConsumer
http://www.aboutyun.com/thread-11117-1-1.html
1.Kafka如何实现和Consumer之间的交互?
2.使用SimpleConsumer有哪些弊端呢?


一个阿里巴巴程序员的心路历程
http://www.aboutyun.com/thread-11122-1-1.html


NewSQL、NoSQL与OldSQL之混合部署应用方案
http://www.aboutyun.com/thread-11123-1-1.html
1、大数据架构的模式有哪些?
2、目前在国内市场上,都有哪些国产数据库?
3、行业大数据应用中使用哪种部署?

打造顶级大数据团队的几个偏方
http://www.aboutyun.com/thread-11124-1-1.html
1、如何理解数据分析团队多元化的优势?
2、你准备向数据分析系统提出什么样的问题?
3、什么是分析方法/算法?

数据挖掘中易犯的几大错误
http://www.aboutyun.com/thread-11125-1-1.html
1、数据挖掘,几大易犯错误包括哪些?
2、如何理解数据挖掘,最核心的是人?

OpenStack在天河二号的大规模部署实践
http://www.aboutyun.com/thread-11126-1-1.html
1、如何看待OpenStack大规模部署所遭遇的挑战?
2、为提高服务的性能,做了哪些参数调整?
3、OpenStack,一次性能同时启动多少个VM?



资源:

storm英文书籍:Getting Started with Storm
http://www.aboutyun.com/thread-11110-1-1.html

eclipse-plugin-2.6.0.jar插件下载
http://www.aboutyun.com/thread-11103-1-1.html

开发高效的Hive程序
http://www.aboutyun.com/thread-11109-1-1.html

hadoop2伪分布,调试,全布安装及配置详解
http://www.aboutyun.com/thread-11105-1-1.html

问答:

一张细化了的hbase存储结构图
http://www.aboutyun.com/thread-11101-1-1.html

spark读取hbase数据报错java.io.NotSerializableException: org.apache.hadoop.hba
http://www.aboutyun.com/thread-11102-1-1.html


如何知道执行shell命令是成功还是失败
http://www.aboutyun.com/thread-11106-1-1.html

hbase数据快速导入方案--bulkload
http://www.aboutyun.com/thread-11111-1-1.html

【求助】 我的CDH中不产生Container日志
http://www.aboutyun.com/thread-11118-1-1.html

spark任务 在spark-shell上能跑,但是在spark-submit上报错
http://www.aboutyun.com/thread-11119-1-1.html


[求助]spark程序正常运行,最后报个nio的错误
http://www.aboutyun.com/thread-11120-1-1.html


HBaseAdmin创建很慢
http://www.aboutyun.com/thread-11127-1-1.html








about云2015年01月08日每日一读

每天进步一点点


2015年薪酬最高的五个IT职位(大数据居首)
http://www.aboutyun.com/thread-11096-1-1.html


Docker入门教程汇总
http://www.aboutyun.com/thread-11098-1-1.html


Docker入门教程(五)Docker安全
http://www.aboutyun.com/thread-11082-1-1.html
1.运行容器应该使用哪个命令?
2.Control Groups是非常重要的组件,具有哪些功能?

Docker入门教程(六)另外的15个Docker命令
http://www.aboutyun.com/thread-11083-1-1.html
1.如何用命令管理容器的后台进程?
2.如何来构造一个镜像?

Docker入门教程(七)Docker API
http://www.aboutyun.com/thread-11084-1-1.html
1.Docker提供了很多的API以便用户使用,这些API包含哪些方面?
2.特殊的library仓库都有哪些需要管理员权限的命令?


Docker入门教程(八)Docker Remote API
http://www.aboutyun.com/thread-11085-1-1.html
1.什么是Docker Remote API?
2.什么是cURL?可以用它来干什么?


Docker入门教程(九)10个镜像相关的API
http://www.aboutyun.com/thread-11097-1-1.html
1.镜像有几种创建方式?
2.本文讲了对镜像哪些操作?


HBase常见问题汇总
http://www.aboutyun.com/thread-11088-1-1.html
1.Scanner的Caching与Batch有什么区别?
2.Region个数越多越好吗?
3.WAL操作日志的开销有多大?
4.Rowkey中包含时间戳导致空Region有什么问题?

NoSQL性能对比测试,SequoiaDB、MongoDB以及Cassandra三家各有千秋
http://www.aboutyun.com/thread-11091-1-1.html
1、NoSQL性能对比测试有哪些指标?
2、SequoiaDB、MongoDB以及Cassandra有哪些不同的表现?

Kmeans++和KNN算法比较
http://www.aboutyun.com/thread-11093-1-1.html
1、什么是K-Means?
2、KNN和K-Means的区别有哪些?
3、K-Means有哪些缺陷?

聚类算法总结
http://www.aboutyun.com/thread-11094-1-1.html
1、聚类算法的种类有哪些?
2、聚类分析研究的主要内容有哪些?
3、传统聚类方法中存在哪些问题?


请教个问题,hdfs有自定义资源分配吗?
http://www.aboutyun.com/thread-11095-1-1.html






资源:

impala文档
http://www.aboutyun.com/thread-11089-1-1.html

impala 2.0的一些相关介绍
http://www.aboutyun.com/thread-11090-1-1.html

openstack视频
http://www.aboutyun.com/thread-11099-1-1.html



问答:

HFile中hbase块的存储问题
http://www.aboutyun.com/thread-11080-1-1.html

读《Hbase权威指南》的一个疑问
http://www.aboutyun.com/thread-11086-1-1.html








about云2015年01月07日每日一读

每天进步一点点

Openstack工程的持续集成实践
http://www.aboutyun.com/thread-11071-1-1.html
1、什么是持续集成(CI)?
2、直接使用keystone自带的tox.ini,会遇到哪些问题?
3、openstack的持续集成包括哪些内容?


Docker入门教程(一)介绍
http://www.aboutyun.com/thread-11065-1-1.html
1.Docker特性主要包括哪些?
2.Docker有哪些组件和哪些基本元素?

Docker入门教程(二)命令
http://www.aboutyun.com/thread-11067-1-1.html
1.忘记了docker命令,可以用哪个命令查看有关docker的命令?
2.docker镜像一般存储在哪儿?用什么命令进行查看?


Docker入门教程(三)DockerFile
http://www.aboutyun.com/thread-11066-1-1.html
1.什么是Dockerfile?
2.它能够做什么事情?

Docker入门教程(四)Docker Registry
http://www.aboutyun.com/thread-11068-1-1.html
1.什么是Docker Registry?
2.Docker Registry有哪些角色?分别是什么?






Apache Spark源码走读汇总
http://www.aboutyun.com/thread-11064-1-1.html


Hive基于搜狗搜索的用户日志行为分析
http://www.aboutyun.com/thread-11063-1-1.html
1.本文是如何学习大数据的?
2.用户查询中包含的中文、英文字数的平均个数,本文提出哪两个思路?
3.用户访问应用的时间特点如何使用hive实现统计的?

Cloudera Manager和Managed Service的数据库及监控数据的存储
http://www.aboutyun.com/thread-11062-1-1.html
1.怎样配置外部表?
2.Cloudera Manager5为什么使用levelDB数据库?
3.Host Monitor 默认数据存储在什么位置?


Cloudera hadoop配置文件地址和修改配置属性方法
http://www.aboutyun.com/thread-11057-1-1.html
1.cloudera 的配置文件路径默认在什么位置?
2.如何通过cloudera manager web UI修改配置文件?

Cloudera Manager 入门:安装详解
http://www.aboutyun.com/thread-11056-1-1.html
1.cloudera manager本文讲了几种方式?
2.这三种方式分别如何安装?

Azure的NoSQL技术
http://www.aboutyun.com/thread-11072-1-1.html
1、如何理解nosql兴起的背景?
2、Hadoop软件给了我们分析这种数据提供了哪些可能?
3、如何理解nosql的不同存储?

Windows Azure的混合云时代
http://www.aboutyun.com/thread-11073-1-1.html
1、如何看待公有云和私有云的发展?
2、Azure公有云提供了哪些体验?
3、Azure混合云当前有哪些企业应用?

MongoDB对手——NoSQL数据库SequoiaDB正式开源
http://www.aboutyun.com/thread-11074-1-1.html
1、SequoiaDB和MongoDB有何不同?
2、如何理解SequoiaDB开源的背后?

资源:

Lucene搜索引擎
http://www.aboutyun.com/thread-11078-1-1.html

Hadoop YARN基本框架和发展趋势文档分享
http://www.aboutyun.com/thread-11077-1-1.html


问答:

clouderaManager出现HostMonitor异常,求大虾指点
http://www.aboutyun.com/thread-11054-1-1.html

往Cloudfoundry上发布APP时Checking 报错
http://www.aboutyun.com/thread-11055-1-1.html

关于return code X from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
http://www.aboutyun.com/thread-11058-1-1.html

hadoop如何添加第三方jar包
http://www.aboutyun.com/thread-11059-1-1.html

如何将Hadoop API 引入到 Servlet Tomcat
http://www.aboutyun.com/thread-11060-1-1.html


Cloudera bin和lib在什么位置
http://www.aboutyun.com/thread-11061-1-1.html

hadoop如何读取压缩包内的文件内容
http://www.aboutyun.com/thread-11070-1-1.html

















about云2015年01月06日每日一读

每天进步一点点

整合Kafka到Spark Streaming——代码示例和挑战
http://www.aboutyun.com/thread-11052-1-1.html
1.什么是Spark Streaming?
2.本文如何性能调优的?
3.本文讲的那个例子?


以亲身体验解说:Docker到底解决了什么问题
http://www.aboutyun.com/thread-11051-1-1.html
1.使用Docker带来哪些好处?
思考及解决:
1.为什么通过Docker可以简单快速部署一个满足自己需求的电商网站?
2.Docker技术可以完美解决服务打包的问题?

Hortonworks:2015年Hadoop即将爆发
http://www.aboutyun.com/thread-11040-1-1.html
1、如何看待Hadoop的企业应用?
2、什么是数据湖?
3、眼下大数据增长最快的需求来自于什么?


从无到有,搭建一个简单版的JAVA PAAS云平台
http://www.aboutyun.com/thread-11041-1-1.html
1、怎样搭建一个入门的PAAS云平台?
2、如何设置多台宿主机路由?
3、设置PAAS路由,需要做哪些准备?


Docker Image管理学习笔记
http://www.aboutyun.com/thread-11042-1-1.html
1、Docker火热的原因是什么?
2、docker run命令实际的执行主要分为哪些?
3、docker是如何对镜像管理的?

Apache Spark源码走读之24 -- Sort-based Shuffle的设计与实现
http://www.aboutyun.com/thread-11047-1-1.html
1.sort-based shuffle算法会产生哪些中间文件?
2.如果是使用SORT,效果如何呢?


解析IntelliJ IDEA内部设计
http://www.aboutyun.com/thread-11050-1-1.html
1.Intellij IDEA的设计和实现使用了哪些模式?
2.Intellij IDEA为什么以模块化的方式组织?



资源:

视频推荐与大数据架构介绍(23页)
http://www.aboutyun.com/thread-11033-1-1.html

pig编程英文版【222页】
http://www.aboutyun.com/thread-11045-1-1.html

Apache Mahout入门【英文版45页】
http://www.aboutyun.com/thread-11046-1-1.html

大数据相关22文档(spark、pig、Cassandra、Redis、Shark、hive、hbase)等英文资料
http://www.aboutyun.com/thread-11048-1-1.html

Scala编程英文版第一版第二版
http://www.aboutyun.com/thread-11049-1-1.html




问答:


storm的上下文对象TopologyContext如何获取
http://www.aboutyun.com/thread-11038-1-1.html

hbase中一行数据可以跨region存储吗?
http://www.aboutyun.com/thread-11035-1-1.html

hadoop HA 中的standby namenode问题
http://www.aboutyun.com/thread-11029-1-1.html

security hadoop持续认证失败
http://www.aboutyun.com/thread-11030-1-1.html

Pig脚本执行后2个map但是一直很慢
http://www.aboutyun.com/thread-11034-1-1.html

有没有关于cloudera 源码的相关网址
http://www.aboutyun.com/thread-11044-1-1.html





about云2015年01月05日每日一读

每天进步一点点


互联网三巨头(BAT)大战解析:百度亏本挑战阿里推出一分钱购买活动
http://www.aboutyun.com/thread-11020-1-1.html



Apache Spark源码走读之22 -- 浅谈mllib中线性回归的算法实现
http://www.aboutyun.com/thread-11018-1-1.html
1.机器学习算法基本遵循怎样的思路?
2.如何求得损失函数的最优解?


Apache Spark源码走读之23 -- Spark MLLib中拟牛顿法L-BFGS的源码实现
http://www.aboutyun.com/thread-11019-1-1.html
1.牛顿法有哪些优点体现?
2.L-BFGS算法中使用到的正则化方法是什么?

12306:分布式内存数据技术为查询提速75倍
http://www.aboutyun.com/thread-11016-1-1.html
1、可以将计算架构分为哪几代?
2、当前计算架构的瓶颈在哪里?
3、如何理解分布式内存数据技术?



大数据到底有没有作用:美国农场主Kip Tom年投资回报率从14%提高到了21.2%
http://www.aboutyun.com/thread-11013-1-1.html



YARN内存使用优化配置
http://www.aboutyun.com/thread-11009-1-1.html
1.Yarn集群的内存分配配置在哪个文件中配置?
2.如何配置每个map及reduce内存?
3.单个任务最小内存该如何配置?





ceilometer的数据采集机制入门
http://www.aboutyun.com/thread-11006-1-1.html
1.ceilometer负责什么事情?
2.ceilometer 有哪些概念?
3.ceilometer 如何采集hardware?



【Hadoop学习】CDH5.2安装部署
http://www.aboutyun.com/thread-11010-1-1.html
1、CDH5.2安装部署,需要哪些条件?
2、需要将哪些文件复制到集群中的所有主机上?
3、如何测试YARN?


Apache Spark源码走读之21 -- WEB UI和Metrics初始化及数据更新过程分析
http://www.aboutyun.com/thread-11014-1-1.html
1.http server是如何启动的?
2.页面中的数据是从哪里获取到的?


聊聊云计算和虚拟化
http://www.aboutyun.com/thread-11017-1-1.html
1、云计算和虚拟化有何不同?
2、云计算和虚拟化有哪些特点?

资源:


美团数据仓库的演进
http://www.aboutyun.com/thread-11023-1-1.html

openstack 六文档分享
http://www.aboutyun.com/thread-11024-1-1.html

zookeeper英文书籍(238页)
http://www.aboutyun.com/thread-11025-1-1.html

CloudStack_4.4_安装(24页)
http://www.aboutyun.com/thread-11026-1-1.html

mirantis openstack(version 5.1.1) user guid(95页)
http://www.aboutyun.com/thread-11027-1-1.html


问答;


关于hive的一个分区添加数据问题
http://www.aboutyun.com/thread-11000-1-1.html

hive如何获取shell当天日期,并创建分区表
http://www.aboutyun.com/thread-11002-1-1.html

使用ceilometer监控,获取虚拟机的memory失败
http://www.aboutyun.com/thread-11003-1-1.html

Yarn为什么没有根据电脑配置进行任务分配
http://www.aboutyun.com/thread-11005-1-1.html

hbase0.96.0以后的endpoint介绍
http://www.aboutyun.com/thread-11007-1-1.html

hadoop 2.x升级异常

http://www.aboutyun.com/thread-11011-1-1.html

用oracle VM virtualbox安装linux系统每次完成安装后reboot,就会弹出“oracle VM
http://www.aboutyun.com/thread-11012-1-1.html








about云2015年01月04日每日一读

每天进步一点点

HBase基本数据操作详解【精品】
http://www.aboutyun.com/thread-10989-1-1.html
1.hbase创建表如何指定版本?
2.通过哪个对象设置列族的特性?
3.hbase如何获取单行数据?



Apache Spark源码走读之18 -- 使用Intellij idea调试Spark源码
http://www.aboutyun.com/thread-10993-1-1.html
1.如果出现提示内容"is waiting for .sbt.ivy.lock",该怎么办?
2.怎么解决sbt/sbt gen-idea的时候没有很好的解决依赖关系?


Apache Spark源码走读之19 -- standalone cluster模式下资源的申请与释放
http://www.aboutyun.com/thread-10994-1-1.html
1.构成Standalone cluster部署模式的四大组成部件有哪些?分别有什么功能?
2.WorkerInfo在schedule函数中会被使用到,schedule函数处理逻辑是怎样的?


Apache Spark源码走读之20 -- ShuffleMapTask计算结果的保存与读取
http://www.aboutyun.com/thread-10995-1-1.html
1.Shuffle数据的写入和读取过程是怎样的?
2.HashShuffleReader中的read函数的具体实现是怎样的?


新浪对移动云定义
http://www.aboutyun.com/thread-10999-1-1.html
1.移动云是什么?
2.移动云能做什么?


HBase(0.96以上版本)过滤器Filter详解及实例代码
http://www.aboutyun.com/thread-10990-1-1.html
1.ColumnRangeFilter作用是什么?
2.列值过滤器--SingleColumnValueFilter的作用是什么?
3.当需要根据行键特征查找一个范围的行数据时,使用哪种查询方法会更高效?


关于hbase中RowLock的说明
http://www.aboutyun.com/thread-10987-1-1.html



问答:


【已解决】使用hbase shell 命令get_counter的问题
http://www.aboutyun.com/thread-10992-1-1.html

mapreduce同时读取mysql和hdfs文件
http://www.aboutyun.com/thread-10998-1-1.html

CDH5.x的Maven依赖从哪里可以找到
http://www.aboutyun.com/thread-10991-1-1.html




about云2015年01月03日每日一读

每天进步一点点

中国的程序员为什么自嘲为码农?
http://www.aboutyun.com/thread-10983-1-1.html


互联网的两个时代:拉信息时代和推信息时代
http://www.aboutyun.com/thread-10981-1-1.html
1.拉取信息主要用来做什么?
2.推信息,主要推什么信息?


大数据翻页的难点和技巧
http://www.aboutyun.com/thread-10984-1-1.html
1.List数据访问模型常见的有哪两种方式?
2.本文提出的方案有什么不足?


hbase入门、原理总结
http://www.aboutyun.com/thread-10982-1-1.html
1.Zookeeper在hbase中到底为我们干了什么?
2.本文如何讲解HBase的工作原理?
3.Hadoop、ZooKeeper和HBase之间启动和关闭顺序?


项目区
hive统计信息通过sqoop导入mysql
http://www.aboutyun.com/thread-10978-1-1.html


资源

如何学习openstack及SDN and openstack文档下载
http://www.aboutyun.com/thread-10977-1-1.html


问答;

zeromq的安装问题
http://www.aboutyun.com/thread-10980-1-1.html






about云2015年01月02日每日一读

每天进步一点点

Apache Spark源码走读之15 -- Standalone部署模式下的容错性分析
http://www.aboutyun.com/thread-10972-1-1.html
1.standalone部署方式下的包含哪些主要节点?
2.Standalone集群的启动以及应用提交时,各节点之间有哪些消息交互?

Apache Spark源码走读之16 -- spark repl实现详解
http://www.aboutyun.com/thread-10973-1-1.html
1.scala是需要编译才能执行的语言,但提供的scala repl可以实现代码的实时交互式执行,这是为什么呢?
2.既然scala已经提供了repl,为什么spark还要自己单独搞一套spark repl,这其中的缘由到底何在?


Apache Spark源码走读之17 -- 如何进行代码跟读
http://www.aboutyun.com/thread-10975-1-1.html
1.Spark基于Akka来进行消息交互,那如何知道谁是接收方呢?
2.对代码作了修改之后,如果并不想提交代码,那该如何将最新的内容同步到本地呢?


[HBase]Region location
http://www.aboutyun.com/thread-10969-1-1.html
1.如何某一个row对应的region是在哪台Region server上?
2.  -ROOT-、.META.表作用是什么?


OpenStack的数据库开发基础 — SQLAlchemy
http://www.aboutyun.com/thread-10968-1-1.html
1.OpenStack 是否为 Python 开发的项目?
2.为什么使用SQLAlchemy?
3.SQLAlchemy 架构包含哪些内容?


问答:

dashboard上无法启动云主机
http://www.aboutyun.com/thread-10971-1-1.html

CDH 5.2 :Impala和Hive集成Sentry
http://www.aboutyun.com/thread-10970-1-1.html

新年第一问,关于hbase的数据版本问题
http://www.aboutyun.com/thread-10966-1-1.html

数据可视化问题
http://www.aboutyun.com/thread-10965-1-1.html








about云2015年01月01日(新年快乐)每日一读

每天进步一点点

Storm实战常见问题及解决方案
http://www.aboutyun.com/thread-10960-1-1.html



Apache Spark源码走读之12 -- Hive on Spark运行环境搭建
http://www.aboutyun.com/thread-10955-1-1.html
如何搭建Hive On Spark的测试环境?


Apache Spark源码走读之13 -- hiveql on spark实现详解
http://www.aboutyun.com/thread-10956-1-1.html
1.Hive中有几种数据模型?
2.HiveQL的执行过程是怎样的?


Apache Spark源码走读之14 -- Graphx实现剖析
http://www.aboutyun.com/thread-10957-1-1.html
1.什么是图的并行化处理?
2.为什么要引入triplets?

HDFS snapshot操作实战
http://www.aboutyun.com/thread-10953-1-1.html
1.Snapshot有哪些用处?
2.如何利用Snapshot进行hdfs文件系统备份?

HDFS NFS网关
http://www.aboutyun.com/thread-10952-1-1.html
1.如何启停NFS网关服务?
2.如何有效挂载NFS?


资源:
storm入门英文:Apache Storm Architecture and Integration
http://www.aboutyun.com/thread-10962-1-1.html

中谷python中文视频教程(全38集)
http://www.aboutyun.com/thread-10959-1-1.html

HBase云存储(37页ppt)
http://www.aboutyun.com/thread-10951-1-1.html

数据挖掘一套视频
http://www.aboutyun.com/thread-10950-1-1.html



问答:


HBase HA (多HMaster)
http://www.aboutyun.com/thread-10961-1-1.html

storm tuple的概念
http://www.aboutyun.com/thread-10958-1-1.html





已有(1)人评论

跳转到指定楼层
june_fu 发表于 2015-2-1 00:10:25
good job ,thanks
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条