分享

about云每日一读汇总(第九篇2015.06.21)



about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)


about云2015年08月31日每日一读

为什么有些人用一年时间获得了你十年的工作经验?
http://www.aboutyun.com/thread-14998-1-1.html




Python性能优化的20条建议
http://www.aboutyun.com/thread-14996-1-1.html
1.copy与deepcopy有什么区别?
2.dict或set是怎样查找元素的?
3.怎样实现反序列化?
4.Python中有哪些性能分析工具?



数据挖掘(2):关联规则FpGrowth算法
http://www.aboutyun.com/thread-14997-1-1.html
1.FpGrowth算法通过什么数据结构来压缩数据记录?
2.怎样构造FpGrowth算法的数据结构?
3.怎样使用FpGrowth算法?



Azure CTO:什么才是真正的混合云?
http://www.aboutyun.com/thread-14999-1-1.html


hadoop入门之hadoop学习总结【分享】
http://www.aboutyun.com/thread-15002-1-1.html



资源:
统计学方法与数据分析引论
http://www.aboutyun.com/thread-15000-1-1.html


R语言_复杂数据统计方法_基于R的应用【240页】
http://www.aboutyun.com/thread-15001-1-1.html




about云2015年08月30日每日一读

亿级规模的Elasticsearch优化实战
http://www.aboutyun.com/thread-14986-1-1.html
1.生产环境JVM采用什么样的参数设置?FULL GC频率和时间如何?
2.分组统计(Facet 查询或 aggregations )大多数时候让它在后端进行运算,怎么实现?应用如果需要实时进行统计而且并发量较大,如何优化?3.存进Elasticsearch的数据,timestamp是UTC时间,Elasticsearch集群会在UTC 0点,也就是北京时间早上8点自动执行优化?如何改参数设置这个时间?
3.Elasticsearch配置bootstrap.mlockall,我们在使用中发现会导致启动很慢,因为Elasticsearch要获取到足够的内存才开始启动。
4.Elasticsearch适合做到10亿级数据查询,每天千万级的数据实时写入或更新吗?
5.Elasticsearch相比Solr有什么优势吗?
6.分词用的什么组件?Elasticsearch自带的吗?
7. reindex有没有好的方法?




CDH5.4下安装部署Spark1.4.1下SparkR
http://www.aboutyun.com/thread-14993-1-1.html
1.部署Spark1.4.1下SparkR包含哪些步骤?
2.如何运行运行sparkR?


数据挖掘(1):关联规则挖掘基本概念与Aprior算法
http://www.aboutyun.com/thread-14987-1-1.html
1.怎样定义关联规则、自信度、自持度?
2.什么是关联规则挖掘?
3.什么是Apriori定律?



hadoop2.7配置:从hadoop集群转换为HA高可用集群配置改变【随记】
http://www.aboutyun.com/thread-14992-1-1.html



hadoop配置HA后与hbase整合,hbase所必须做的修改
http://www.aboutyun.com/thread-14991-1-1.html




问答:
【求助】dashboard报“错误:无法连接到Neutron”,请各位大神帮忙!小弟谢谢了。
http://www.aboutyun.com/thread-14990-1-1.html



reduce里面适合对数据进行写入oracle吗?
http://www.aboutyun.com/thread-14985-1-1.html



资源:

全美经典学习系列:统计学(第三版)【411页】
http://www.aboutyun.com/thread-14988-1-1.html


HTML5 精品教程
http://www.aboutyun.com/thread-14989-1-1.html





about云2015年08月29日每日一读


深入了解spark运行计划及调优
http://www.aboutyun.com/thread-14976-1-1.html
1.首次运行hive-console需要什么条件?
2.运行hive/console是否需要启动Spark?
3.如何查看查询的Unresolved LogicalPlan?
4.如何查看不同查询的运行计划?
5.SparkSQL如何调优?



Region拆分逻辑
http://www.aboutyun.com/thread-14974-1-1.html
1、Region拆分前提是什么?
2、Region如何回去拆分点?
3、Region的具体拆分过程是什么?



从草稿到发布 —— 诠释分析API的设计过程
http://www.aboutyun.com/thread-14975-1-1.html
1.草图设计有什么作用?
2.档案在草图设计中的作用是什么?
3.你认为可视化工具在草图设计的作用是什么?



人肉工程在机器学习实践中的作用
http://www.aboutyun.com/thread-14972-1-1.html
1、机器是如何理解数据?
2、机器学习建模过程分为哪几个步骤?
3、机器能否通过“学习”达到和人的知识相同的效果?






资源:

细细品味架构_第1期(实时计算在点评)
http://www.aboutyun.com/thread-14983-1-1.html


Ceph 0.94.3 for CentOS 7.1
http://www.aboutyun.com/thread-14979-1-1.html



Spark读取Kafka
http://www.aboutyun.com/thread-14982-1-1.html





问答:

CDH5.4.5 重启集群后 启动hdfs时 namenode无法启动
http://www.aboutyun.com/thread-14970-1-1.html


journal commit i/o error 如何修复???
http://www.aboutyun.com/thread-14973-1-1.html


kerberos下HBase访问Zookeeper的ACL权限访问列表问题解决过程记录
http://www.aboutyun.com/thread-14977-1-1.html


hadoop1 与hadoop2 fair-schduler调度器 配置和使用
http://www.aboutyun.com/thread-14978-1-1.html


Hbase中已经创建好的表org.apache.hadoop.hbase.DoNotRetryIOException:
http://www.aboutyun.com/thread-14980-1-1.html


刚开始部署hadoop2.5.2,部署完后启动成功,但是过一会namenode会全部死掉
http://www.aboutyun.com/thread-14981-1-1.html




about云2015年08月28日每日一读



链式mapreduce作业实例【代码实现】
http://www.aboutyun.com/thread-14966-1-1.html
1.什么链式mapreduce?
2.链式mapreduce解决了什么问题?
3.如何实现链式mapreduce?



Hive介绍及部署最详细文档
http://www.aboutyun.com/thread-14958-1-1.html

1、Hive的概念以及优缺点。
2、Hive的执行流程。
3、了解Hive的运行框架,以及Hive架构包括哪些组件?
4、Hive的搭建过程。
5、如何设置安装Mysql、设置root密码、Hive用户和创建Hive数据库?
6、安装Hive过程中如何设置相关的环境变量?

7、如何验证Hive是否安装成功?
8、解决问题:设置MySql数据库root用户密码报错、Hive启动,报CommandNeedRetryException异常。



如何在一个简单的 REST客户端使用 SQL,Hadoop,Drill?
http://www.aboutyun.com/thread-14959-1-1.html
1、了解Apache Drill和MapR沙箱。
2、如何使用 Drill REST API来查询 HBase 和 Hive?
3、如何使用Drill REST 做一个简单的客户端?





Docker 1.8.0容器安全性提升:增加Content Trust
http://www.aboutyun.com/thread-14961-1-1.html



大数据问答解析
http://www.aboutyun.com/thread-14962-1-1.html




资源:

程序员生存定律
http://www.aboutyun.com/thread-14967-1-1.html




爱上统计学.Statistics.for.people.Who【282页】
http://www.aboutyun.com/thread-14968-1-1.html



问答:

eclipse访问dhfs出现文件不存在
http://www.aboutyun.com/thread-14953-1-1.html



hadoop中datanode节点连不上,如图
http://www.aboutyun.com/thread-14954-1-1.html



Juno neutron 创建多个外网
http://www.aboutyun.com/thread-14955-1-1.html



Hadoop-2.5.2安装详解
http://www.aboutyun.com/thread-14956-1-1.html


Apache on tez hive
http://www.aboutyun.com/thread-14960-1-1.html



nutch 2.3 网站注入失败
http://www.aboutyun.com/thread-14964-1-1.html


hbase遇到问题NoRouteToHostException: No route to host及解决办法
http://www.aboutyun.com/thread-14965-1-1.html





about云2015年08月27日每日一读




openstack ironic入门学习1:用ironic安装openstack的原理
http://www.aboutyun.com/thread-14946-1-1.html
1.本文认为ironic原理是什么?
2.当前ironic无法用来安装PC机的原因是什么?
3.ironic部署包含哪些流程?


openstackironic入门学习2:ironic 安装部署
http://www.aboutyun.com/thread-14947-1-1.html
1.ironic 安装部署包含哪些步骤?
2.控制节点需要做哪些修改?
3.计算节点需要做哪些修改?



Hive实战
http://www.aboutyun.com/thread-14943-1-1.html
1、Hive如何创建内部表并加载数据?
2、Hive如何创建外部表关联数据?
3、Hive如何加载数据到外部表?
4、本文给出了具体例子进行了演示,希望可以帮助大家更好的理解Hive操作。


Apache Spark受欢迎的六大特点
http://www.aboutyun.com/thread-14949-1-1.html
1.Spark为高级分析提供了哪些框架?
2.你认为spark与hadoop有哪些不同?
3.Spark是否兼容hadoop所有版本?



hive学高级查询常用函数关键字总结
http://www.aboutyun.com/thread-14942-1-1.html
1、Hive查询语句和SQL查询语句区别与联系。
2、distribute by、group by和Sort by的区别。
3、MapJoin的优缺点是什么?




KafkaSpout代码分析及配置
http://www.aboutyun.com/thread-14944-1-1.html
1.KafkaSpout的配置中有哪两个地方可以用到Zookeeper?
2.影响初始读取进度的配置项有哪些?


KafkaSpout之PartitionManager
http://www.aboutyun.com/thread-14945-1-1.html
1.本文认为KafkaSpout的核心逻辑由谁来完成?
2.PartitionManager的主要功能是什么?
3.实现PartitionManager需要考虑哪些问题?



资源:

数据挖掘与知识发现].李雄飞.文字版
http://www.aboutyun.com/thread-14950-1-1.html


自己动手写网络爬虫
http://www.aboutyun.com/thread-14951-1-1.html





问答:

storm中关于kafkSpout的问题求教
http://www.aboutyun.com/thread-14938-1-1.html


新人求助,OpenStack的一些问题
http://www.aboutyun.com/thread-14939-1-1.html


zookeeper是否可以用来做nginx的HA?或者替他软件的HA
http://www.aboutyun.com/thread-14940-1-1.html


Sapark Streaming ,window和RDD的转换问题
http://www.aboutyun.com/thread-14941-1-1.html




Kafka kafka.common.OffsetOutOfRangeException解决方案分享
http://www.aboutyun.com/thread-14948-1-1.html

ubuntu 远程连接黑屏
http://www.aboutyun.com/thread-14937-1-1.html



about云2015年08月26日每日一读


MapReduce应用案例1
http://www.aboutyun.com/thread-14931-1-1.html
1.各个部门的总工资如何进行问题分析的?
2.各个部门的总工资处理流程是怎样的?
3.个部门的人数和平均工资又是如何得到的?
4.个部门的人数和平均工资代码如何实现?



MapReduce应用案例2
http://www.aboutyun.com/thread-14932-1-1.html



每个程序员都应该知道的8个Linux命令
http://www.aboutyun.com/thread-14929-1-1.html
1.连接两个文件,并输出结果,使用的是什么命令呢?
2.文件里的文字按行排序使用的是哪个命令?
3.打印出匹配条件的文字行使用的是哪个命名?
4.删除文件中字符行上的某些区域使用的是哪个命令?
5.如何删除重复行?
6.如何搜索文件目录中的文件?
7.如何在文件里向前或向后移动?
8.如何用sed命令变换文件行?




Hadoop之YARN命令
http://www.aboutyun.com/thread-14930-1-1.html
1.对于Hadoop集群用户有哪些有用的命令?
2.打印需要得到Hadoop的jar和所需要的lib包路径使用的什么命令?
3.对hadoop集群的管理员有哪些很有用的命令?



CDH5.1从Flume采集到索引(Solr)
http://www.aboutyun.com/thread-14925-1-1.html


资源:
R语言实战
http://www.aboutyun.com/thread-14935-1-1.html



Hadoop入门进阶各种包
http://www.aboutyun.com/thread-14933-1-1.html


R语言经典入门
http://www.aboutyun.com/thread-14934-1-1.html





问答:

hadoop2生态系统版本
http://www.aboutyun.com/thread-14921-1-1.html


求solr+flume的搭建文档
http://www.aboutyun.com/thread-14923-1-1.html


新手求助!无法启动实例
http://www.aboutyun.com/thread-14924-1-1.html



CDH5 环境搭建
http://www.aboutyun.com/thread-14926-1-1.html


求助 OpenStack K版,启动win7 64位系统蓝屏
http://www.aboutyun.com/thread-14928-1-1.html






about云2015年08月25日每日一读

刘鹏:不了解计算广告就难以真正理解大数据
http://www.aboutyun.com/thread-14912-1-1.html
1.能否从计算广告形成的背景、发展的趋势出发,分享计算广告对当今技术从业者带来的影响?
2.目前很多互联网公司的都采用了机器学习来做各种预测分析,那么为了实现更精准高效的效果,计算广告必然要走向与人工智能、机器学习尤其是深度学习的结合吗?
3.面对计算广告的任务,技术人员需要掌握哪些方面的技能和工具?有没有比较好的学习路径以及职业发展规划可以推荐?
4.目前计算广告现在还有哪些需要解决的问题?


程序员的年龄天花板
http://www.aboutyun.com/thread-14908-1-1.html

Hadoop(最新版 ChainMapper 链式MapReduce 代码实现及原理分析)
http://www.aboutyun.com/thread-14910-1-1.html
1.本文实现了什么功能?
2.遇到了什么问题?
3.ChainMapper原理本文作者是如何理解的?



译:数据科学如何将车联网由理想变为现实?
http://www.aboutyun.com/thread-14914-1-1.html
1.车联网的目的是什么?
2.数据分析技术可以加强车联网的原因是什么?
3.大数据的真正的价值应该是什么?

优秀程序员与优秀码农的区别
http://www.aboutyun.com/thread-14909-1-1.html


通过自动化shell从关系库导入数据到hive-hbase(整合)表中,
http://www.aboutyun.com/thread-14911-1-1.html


资源:
R初级教程153分钟学会R
http://www.aboutyun.com/thread-14915-1-1.html

细细品味Storm_Storm简介及安装V1.1
http://www.aboutyun.com/thread-14916-1-1.html





问答:
hadoop源码编译问题--菜鸟
http://www.aboutyun.com/thread-14902-1-1.html

创建的云主机无法与neutron连接
http://www.aboutyun.com/thread-14904-1-1.html


openstack kilo 执行 openstack service create 失败
http://www.aboutyun.com/thread-14905-1-1.html


glance ERROR glance.common.config
http://www.aboutyun.com/thread-14906-1-1.html


spark程序遇到了这样的问题 Initial job has not accepted any resources
http://www.aboutyun.com/thread-14907-1-1.html


关于 mahout+exclipse 开发环境搭建问题
http://www.aboutyun.com/thread-14913-1-1.html






about云2015年08月24日每日一读


大数据目前还存在的九个问题
http://www.aboutyun.com/thread-14894-1-1.html
1.本人认为是哪九个问题?
2.你是否认同本文观点?
3.你认为哪几个问题是比较中肯的?



HBase 数据库检索性能优化策略
http://www.aboutyun.com/thread-14893-1-1.html
1.HBase是否支持where条件?
2.HBase 的表数据分为哪几个层次?
3.Scan类常用方法有哪些?
4.HBase 数据表优化本文介绍了哪些方法?



Docker基础技术:Linux CGroup实践
http://www.aboutyun.com/thread-14890-1-1.html
1.怎样挂载CGroup?
2.怎样利用CGroup实现CPU控制?
3.怎样利用CGroup实现内存控制?
4.怎样利用CGroup实现I/O控制?


(Apache YARN/Mesos) VS (Google Borg)
http://www.aboutyun.com/thread-14887-1-1.html
1.(Apache YARN/Mesos) 与 (Google Borg) 在架构上有何区别?
2.(Apache YARN/Mesos) 与 (Google Borg) 对批处理作业和长服务的支持有何区别?
3.(Apache YARN/Mesos) 与 (Google Borg) 的其他实现机制有何区别?



storm 并行度总结,欢迎交流
http://www.aboutyun.com/thread-14891-1-1.html


通过生活讲解mapreduce: 登机牌、阅卷与 Map-Reduce(归约)
http://www.aboutyun.com/thread-14886-1-1.html



资源

spark机器学习算法实现【代码】
http://www.aboutyun.com/thread-14899-1-1.html


基于Graphx的大规模用户图计算
http://www.aboutyun.com/thread-14898-1-1.html


spark英文30文档
http://www.aboutyun.com/thread-14897-1-1.html


Twitter Heron-Stream Processing at Scale
http://www.aboutyun.com/thread-14896-1-1.html


hbase-indexer-meetupoct2013-SNO
http://www.aboutyun.com/thread-14885-1-1.html


Intel openstack juno 版本 NFV部署之路
http://www.aboutyun.com/thread-14884-1-1.html




问答

Cygwin下安装hadoop,namenode启动不了?求帮助
http://www.aboutyun.com/thread-14895-1-1.html


在Windows的visual studio下,可以利用C#开发hbase的项目吗?
http://www.aboutyun.com/thread-14892-1-1.html


cdh集群迁移问题
http://www.aboutyun.com/thread-14889-1-1.html


hadoop datanode 不能连接 namenode 各种原因都看过,还没有解决
http://www.aboutyun.com/thread-14888-1-1.html



about云2015年08月23日每日一读


数据分析和数据挖掘的区别
http://www.aboutyun.com/thread-14882-1-1.html

1.什么是数据分析?
2.什么是数据挖掘?
3.
数据分析和数据挖掘的区别。



关于Pig性能优化
http://www.aboutyun.com/thread-14881-1-1.html

1.尽早去除无用的数据。
2.使用Combiner。
3.Join优化。

4.使用压缩来提高性能。
5.设置Reduce的并发数。



在CentOS 6.3 配置iSCSI网络存储
http://www.aboutyun.com/thread-14879-1-1.html
1.iSCSI是什么?
2.iSCSI 的主要功能是什么?
3.iSCSI系统的拓扑结构包含哪些内容?


资源:
Intel openstack juno 版本 NFV部署之路
http://www.aboutyun.com/thread-14884-1-1.html

hbase-indexer-meetupoct2013-SNO
http://www.aboutyun.com/thread-14885-1-1.html




问答

使用Cygwin安装hadoop时,出现问题求助!
http://www.aboutyun.com/thread-14878-1-1.html



求助:openstack的nfv功能是怎么实现的?
http://www.aboutyun.com/thread-14877-1-1.html



【求助】spark运行打包的jar程序,遇到接受不到任务资源的问题
http://www.aboutyun.com/thread-14876-1-1.html



cinder reboot,我的实例都不能启动。。。。求助
http://www.aboutyun.com/thread-14875-1-1.html



控制结点和计算结点都应该安装什么模块?
http://www.aboutyun.com/thread-14872-1-1.html


关于 Maven 编译 Mahout 的问题,求助,谢谢啦~
http://www.aboutyun.com/thread-14871-1-1.html






about云2015年08月22日每日一读


你应该掌握的七种回归技术
http://www.aboutyun.com/thread-14867-1-1.html
1.什么是回归分析?
2.我们为什么使用回归分析?
3.我们有多少种回归技术?





Dockerfile、Docker镜像和Docker容器的关系
http://www.aboutyun.com/thread-14866-1-1.html
1.什么是Docker镜像?
2.Dockerfile、Docker镜像和Docker容器的关系是什么?
3.镜像层包含哪些内容?
4.生产环境中怎么用docker备份mysql数据?



为什么面试总喜欢考算法题?
http://www.aboutyun.com/thread-14861-1-1.html



让结对编程更有效的十种方法
http://www.aboutyun.com/thread-14864-1-1.html




资源:

Apache Solr参考指南- 5.2
http://www.aboutyun.com/thread-14868-1-1.html



OpenStack _ Ceph - Liberty
http://www.aboutyun.com/thread-14869-1-1.html



问答:
【求助】为何我的CDH5.X版本,运行MapReduce后再JobHistory里没有记录
http://www.aboutyun.com/thread-14865-1-1.html




本地win7 eclipse 代码 入数据到服务器linux
http://www.aboutyun.com/thread-14859-1-1.html


本地win7 nutch 注册网站到hbase
http://www.aboutyun.com/thread-14863-1-1.html



如何重装openstack
http://www.aboutyun.com/thread-14856-1-1.html


求助:Spark Logistic Regression的例子看不懂,求解析?
http://www.aboutyun.com/thread-14858-1-1.html



hive sql传入参数的问题
http://www.aboutyun.com/thread-14862-1-1.html




about云2015年08月21日每日一读

360的容器化之路
http://www.aboutyun.com/thread-14847-1-1.html
1、360如何让Docker落地。
2、如何使Docker适配现有技术架构 ,完成线上环境快速部署扩容?
3、使用Docker技术,在构建持续集成环境方面的积累有哪些?
4、使用Docker构建PaaS环境如何加速中小业务快速孵化上线?




MongoDB之备份与恢复
http://www.aboutyun.com/thread-14848-1-1.html
1.MongoDB在不关闭服务器的情况下备份会有哪些问题?
2.MongoDB在不关闭服务器的情况,安全备份有几种方式?
3.mongodump如何实现备份?





一步步教你分析网站数据
http://www.aboutyun.com/thread-14849-1-1.html
1.辨认问题网页(组)通过哪三个参数?
2.什么是跳出和退出率?
3.如何识别识别流失点?







Hadoop学习总结:HDFS读写过程解析
http://www.aboutyun.com/thread-14846-1-1.html
1、HDFS对文件读写代码实现。
2、LocatedBlock包含什么信息?
3、客户端读写文件时首先会调用哪个函数?
4、DataNode启动会调用哪些函数?如何实现?

5、如何实现对DataNode数据块的备份?



资源:
Akka Essentials【Akka 要领334页】
http://www.aboutyun.com/thread-14852-1-1.html


企业云化的痛点与实践_郑罡_易传媒使用Docker云化的技术实践(4:3)
http://www.aboutyun.com/thread-14850-1-1.html


张芸-Deep dive into Docker storage
http://www.aboutyun.com/thread-14851-1-1.html




问答:

新版的hue出现的bug
http://www.aboutyun.com/thread-14843-1-1.html


填充keystone时出错,求助大家(openstakc kilo),实在解决不了了
http://www.aboutyun.com/thread-14844-1-1.html


求助:openstack查看硬件资源问题
http://www.aboutyun.com/thread-14845-1-1.html


求助:关于openstack虚拟机问题
http://www.aboutyun.com/thread-14840-1-1.html





about云2015年08月20日每日一读


Hadoop Web项目--Mahout0.10 MR算法集锦
http://www.aboutyun.com/thread-14830-1-1.html
1、Hadoop Web项目开发的软件环境。
2、该项目是如何调用Mahout0.10的MR算法?
3、如何把MR算法嵌入到Web项目中?
4、如何实现附带数据生成及数据查看、MR 任务监控等功能?





hadoop高级命令详解
http://www.aboutyun.com/thread-14829-1-1.html
1.hadoop Archive的作用是什么?
2.怎么使用hadoop Archive?
3.怎么查找Archive文件?
4.怎样解压Archive文件?
5.本文还介绍了哪些命令?


Hadoop之SequenceFile .
http://www.aboutyun.com/thread-14827-1-1.html
1、SequenceFile的优缺点是什么?
2、SequenceFile的压缩基于CompressType是如何实现读写文件?
3、SequenceFile文件的数据组成形式是什么?用代码实现关键字段。




持续集成:Docker、Maven、Java
http://www.aboutyun.com/thread-14828-1-1.html
1.如何使用Maven构建Docker镜像?
2.每一个docker镜像是否有有它自己的Maven模块?
3.你认为什么是Dockerfile?



Spark入门之基本术语
http://www.aboutyun.com/thread-14833-1-1.html
1.spark job与RDD的关系是什么?
2.什么是Executor?
3.什么是Driver?


Spark运行流程
http://www.aboutyun.com/thread-14834-1-1.html
1.Spark运行包含哪些流程?
2.本文认为Spark运行架构有哪些特点?
3.DAGScheduler的作用是什么?
4. RDD在Spark架构中是如何运行的?
5.Spark on Standalone运行包含哪些过程?




资源:

腾讯云实践之路-刘颖
http://www.aboutyun.com/thread-14836-1-1.html


云机:用友公有云平台虚拟机系统-薛正华
http://www.aboutyun.com/thread-14837-1-1.html




问答:
hadoop MR 任务 报错  Premature EOF from inputStream at org.apache.hadoop.io
http://www.aboutyun.com/thread-14831-1-1.html


storm Error on initialization of server service-handler
http://www.aboutyun.com/thread-14835-1-1.html



求助:hello world程序出错
http://www.aboutyun.com/thread-14824-1-1.html


如何抓出Hadoop的Web监控50070页面信息
http://www.aboutyun.com/thread-14832-1-1.html




求一套实用的hadoop视频教程
http://www.aboutyun.com/thread-14822-1-1.html


大家有没有学习hadoop的方法或资料?
http://www.aboutyun.com/thread-14823-1-1.html



about云2015年08月19日每日一读


云计算1.0时代已过,2.0时代来临
http://www.aboutyun.com/thread-14816-1-1.html
1.云计算1.0到2.0时代有什么变化?
2.云计算2.0的标志是什么?
3.你认为几年内能进入云计算3.0?







日志系统之HBase日志存储设计优化
http://www.aboutyun.com/thread-14815-1-1.html
1.本文认为索引设计存在哪些问题?
2.HBase存储日志的查询该如何优化?




redis在学生抢房应用中的实践小结
http://www.aboutyun.com/thread-14812-1-1.html
1.redis常用的分布式锁的实现方式有哪些?
2.如何保证内存一致性?
3.如何保证数据一致性?
4.DDOS黑名单是怎么设计的?
5.如何处理关系查询?
6.如何使用事务?






弹性MapReduce 4.0.0版本发布,更新应用已可用
http://www.aboutyun.com/thread-14811-1-1.html
1.什么是Amazon?
2.Amazon增添了哪些新特性?
3.需要做哪方面的更新?
4.如何从控制台快速创建集群?
5.针对Spark额外有哪些EMR配置选项?


大数据十大热门职位
http://www.aboutyun.com/thread-14813-1-1.html


资源:

苏宁实时计算平台技术实践
http://www.aboutyun.com/thread-14819-1-1.html



评估面向大数据 ETL的Apache Hadoop 软件
http://www.aboutyun.com/thread-14820-1-1.html




问答:


hadoop mr 或者 spark 操作 hbase时候就出现class com.google.protobuf.HBaseZeroC...
http://www.aboutyun.com/thread-14818-1-1.html




Cinder之前,sysbench IO测试和 sar io监控吞吐量为何不一致?
http://www.aboutyun.com/thread-14810-1-1.html



关于hadoop集群namenode结点挂掉问题
http://www.aboutyun.com/thread-14814-1-1.html


使用hive连接hbase外部表成功,但查询结果为0
http://www.aboutyun.com/thread-14817-1-1.html






about云2015年08月18日每日一读

腾讯游戏使用Docker的?
http://www.aboutyun.com/thread-14799-1-1.html
1.腾讯游戏是什么时候开始使用Docker的?
2.Docker在游戏的业务中有什么样的优势?
3.腾讯游戏的Docker应用场景是怎么样的?
4.腾讯内部推进Docker过程中遇到过哪些阻力?是如何解决的?
5.腾讯使用Docker过程中有哪些坑?做哪些重点改进?


Hadoop的Server及其线程模型分析
http://www.aboutyun.com/thread-14800-1-1.html
1.Listener线程是如何工作的?
2.Reader在server中是如何工作的?
3.Handler在server中是如何调用相应的业务逻辑接口来处理请求的?
4.Responder线程如何与Handler协调并发送数据的?
5.Listener单线程,Reader多线程,Handler多线程,Responder单线程,为什么会这样设计?



谷歌语音转录背后的神经网络
http://www.aboutyun.com/thread-14802-1-1.html
1.在音频处理中,语音识别要考虑哪些因素?
2.在没有人为确认和手工转录的情况下,我们又该怎样来训练模型呢?
3.谷歌怎样做到在语音转录上使用长短期记忆递归神经网络(LSTM RNNs)?



hadoop 断电宕机处理【工作经验分享】
http://www.aboutyun.com/thread-14801-1-1.html


OpenVswitch(文档密码:aireal123456
http://www.aboutyun.com/thread-14808-1-1.html



资源:

中国电信大数据整体介绍
http://www.aboutyun.com/thread-14807-1-1.html





问答:
有没有hadoop2.7.1 hadoop.dll包括winutils.exe?
http://www.aboutyun.com/thread-14804-1-1.html



简单的sql,group by 的结果不是想的那样啊
http://www.aboutyun.com/thread-14805-1-1.html







about云2015年08月17日每日一读

2015年about云08月第3周
http://www.aboutyun.com/thread-14787-1-1.html






hadoop大数据、云技术基础集群搭建之环境变量
http://www.aboutyun.com/thread-14786-1-1.html
1.什么是环境变量?
2.环境变量的作用是什么?
3.举例集群安装中碰到的此类问题?


Flume之FileChannel源码详解
http://www.aboutyun.com/thread-14793-1-1.html
1.FileChannel设置的目录和程序日志文件保存的目录设成不同的磁盘,能达到什么效果?
2.本文中FileChannel包含哪些类?
3.FileChannel中内部事务类、文件操作类你认为完成哪些功能?



hadoop mapreduce的本地模式及yarn模式
http://www.aboutyun.com/thread-14792-1-1.html
1.本地模式与Yarn模式配置有什么区别?
2.Yarn模式有哪两种方式执行任务?
3.uber mode与mr小作业是什么关系?




Redis监控工具,命令和调优
http://www.aboutyun.com/thread-14790-1-1.html
1.Redis图形化监控安装会遇到哪些问题?
2.官方有哪些优化建议?
3.如何实现持续实时监控redis?



高效程序员的狂暴之路
http://www.aboutyun.com/thread-14794-1-1.html


HBase-1.0.1 协处理器比0.94配置变化对比
http://www.aboutyun.com/thread-14785-1-1.html



CloudStack VMware遇到的问题及解决问题的过程
http://www.aboutyun.com/thread-14791-1-1.html


openstack创建实例错误
http://www.aboutyun.com/thread-14784-1-1.html



资源:

[机器学习.汤姆·米切尔].McGrawHill,.Tom.Mitchell.-.Machine.L【更多资源about云...
http://www.aboutyun.com/thread-14797-1-1.html



hadoop各种测试数据下载【10种数据:包括微博关系等】
http://www.aboutyun.com/thread-14795-1-1.html


Scala例子书籍【145页】
http://www.aboutyun.com/thread-14796-1-1.html


问答:
hadoop有没有图形界面的应用
http://www.aboutyun.com/thread-14789-1-1.html




about云2015年08月16日每日一读

一位数据挖掘工程师眼中的“大数据与企业的数据化运营
http://www.aboutyun.com/thread-14778-1-1.html




Hadoop与Spark常用配置参数总结
http://www.aboutyun.com/thread-14775-1-1.html
1.哪个配置项可实现Map Task的JVM参数?
2.容错有哪些参数?
3.本地运行需要配置哪些参数?



Scala 编写库:Akka框架基本要点介绍
http://www.aboutyun.com/thread-14776-1-1.html
1.Akka是什么模型?
2.ActorSystem是什么?
3.Akka Cluster是否存在单点故障?



spark源码【 TaskScheduler】与任务提交原理浅析1
http://www.aboutyun.com/thread-14779-1-1.html
1.本文TaskScheduler创建包含哪些过程?
2.TaskScheduler、TaskSchedulerImpl、SchedulerBackend之间的关系是什么?




spark源码【 TaskScheduler】与任务提交原理浅析2
http://www.aboutyun.com/thread-14780-1-1.html
1.submitMissingTasks本文是如何分析其流程的?
2.TaskSchedulerImpl中的submitTasks包含哪些流程?
3.resourceOffers本文认为主要做了哪3件事?



资源:

Storm分布式实时计算模式
http://www.aboutyun.com/thread-14781-1-1.html


学习spark数据分析书籍下载
http://www.aboutyun.com/thread-14782-1-1.html




问答:
mapreduce计算
http://www.aboutyun.com/thread-14777-1-1.html








about云2015年08月15日每日一读


沈国阳:美团推荐系统整体框架与关键工作
http://www.aboutyun.com/thread-14768-1-1.html
1、美团排序的主要工作包括什么?
2、了解美团推荐系统的整体架构。

3、美团推荐平台的特点有哪些?
4、什么是“本地人热单”策略?它是如何实现的?



阿里感悟-如何才能晋升
http://www.aboutyun.com/thread-14769-1-1.html


还不了解移动云就out了
http://www.aboutyun.com/thread-14770-1-1.html
1.什么是移动云开发?
2.如何对移动云服务进行分类?
3.从什么领域切入移动云服务比较好?
4.目前移动云服务的SaaS化是公认的趋势,是否还有必要做本地化部署?






Python 开发者节省时间的 10 个方法
http://www.aboutyun.com/thread-14767-1-1.html
1、Python最节省时间的技巧是什么?
2、Python与java、c++相比,优势有哪些?

3、本文推荐了学习Python的书,希望对大家有所帮助。




问答:

如何连接openstack swift 与 netdrive或者tntdrive
http://www.aboutyun.com/thread-14764-1-1.html


flume和hdfs是不是必须装在同一台服务器上
http://www.aboutyun.com/thread-14765-1-1.html


从oracle导出blob数据到hbase中的问题
http://www.aboutyun.com/thread-14766-1-1.html




资源:

Kafka  监控工具--KafkaOffsetMonitor使用
http://www.aboutyun.com/thread-14771-1-1.html


深入Python编程
http://www.aboutyun.com/thread-14772-1-1.html


淘宝TFS架构演进
http://www.aboutyun.com/thread-14773-1-1.html




spark programing guide
http://www.aboutyun.com/thread-14763-1-1.html




about云2015年08月14日每日一读

Hadoop  MapReduce  shell命令解析
http://www.aboutyun.com/thread-14757-1-1.html
1.如何查看mapred命令?
2. mapred pipes作用什么?
3.mapred queue的作用是什么?





高效编程秘诀
http://www.aboutyun.com/thread-14754-1-1.html
1、如何高效编程?
2、什是GDT?GTD的核心理念是什么?最核心步骤是该如何做?
3、什么是番茄工作法?






关于推荐系统中的特征工程
http://www.aboutyun.com/thread-14745-1-1.html
1、什么是特征工程?
2、如何描述个性化并且用变量表示成特征?
3、什么是直接特征和间接特征?二者的表达有何区别?

4、本文给出了特征的组合变化深入研究相关论文链接。





资源:
hadoop权威指南第三版和配套源码
http://www.aboutyun.com/thread-14742-1-1.html


Solr 实战2013【263页】
http://www.aboutyun.com/thread-14759-1-1.html



数据中心容灾规划方案
http://www.aboutyun.com/thread-14760-1-1.html




问答:

请教求平均分数问题?
http://www.aboutyun.com/thread-14755-1-1.html


hive1.2.1版本  hive --service hiveserve报错,求解决。。。
http://www.aboutyun.com/thread-14756-1-1.html


Storm 0.9.3开始支持与HDFS、HBase的集成
http://www.aboutyun.com/thread-14758-1-1.html




nutch2.3 实行抓取时报错,忧伤
http://www.aboutyun.com/thread-14747-1-1.html


devstack安装时提示Missing parameter
http://www.aboutyun.com/thread-14748-1-1.html


求助:openstack云硬盘无法挂在
http://www.aboutyun.com/thread-14749-1-1.html


nutch1.1导入eclipse中运行
http://www.aboutyun.com/thread-14750-1-1.html


nutch启动时异常解决办法
http://www.aboutyun.com/thread-14751-1-1.html


devstack  ntp多节点时间不一致导致服务无法启动
http://www.aboutyun.com/thread-14752-1-1.html


创求助:建云硬盘室,如果选择加载镜像,就会创建失败,请大神赐教。。。。
http://www.aboutyun.com/thread-14753-1-1.html





请问有关于openstack 的qq群吗
http://www.aboutyun.com/thread-14739-1-1.html



求助帖:云平台测试评估系统可以做毕业设计吗
http://www.aboutyun.com/thread-14740-1-1.html



招聘Nutch/Hadoop工程师
http://www.aboutyun.com/thread-14743-1-1.html



about云2015年08月13日每日一读


Hadoop分块详解
http://www.aboutyun.com/thread-14734-1-1.html
1.hadoop分块有哪些配置决定?
2.hadoop分块具体是如何实现的?




大众点评容器云平台:运营超一年,承载大部分业务
http://www.aboutyun.com/thread-14728-1-1.html
1、大众点评使用Docker构建云平台有哪些优势和挑战?
2、云平台使用了哪些开源的技术栈?
3、架构方面的问题如何解决?




kafka文档: 配置选项翻译【收藏版】
http://www.aboutyun.com/thread-14731-1-1.html
1.broker.id的作用是什么?
2.max.message.bytes表示什么含义?
3.group.id是用来标识什么的?




Kafka文档:基本介绍(Getting Start)
http://www.aboutyun.com/thread-14732-1-1.html
1.kafka中offset是什么?
2.offset是否由consumer控制?
3.传统消息传递系统采用哪两种模式?









在Docker里运行Ceph
http://www.aboutyun.com/thread-14726-1-1.html
1、Ceph有哪些特点?
2、Ceph运行在Docker上的基本思想是什么?

3、本文采用例子说明Ceph是如何运行在Docker上。
4、在本例中采用什么镜像进行了哪些配置?



资源:

spark编程中文版
http://www.aboutyun.com/thread-14737-1-1.html




企业级搜索引擎Solr基础入门
http://www.aboutyun.com/thread-14735-1-1.html


什么是appache phoenix
http://www.aboutyun.com/thread-14736-1-1.html







问答:

利用keystone rest api 创建policy策略时,返回400错误,抛出类型不匹配
http://www.aboutyun.com/thread-14727-1-1.html



请教storm-kafka关于consumer group的问题
http://www.aboutyun.com/thread-14730-1-1.html


请教hdfs文件分块的问题
http://www.aboutyun.com/thread-14733-1-1.html





dashboard500了
http://www.aboutyun.com/thread-14722-1-1.html


私有云选型评估:OpenStack vs VMware(分享)
http://www.aboutyun.com/thread-14724-1-1.html


service neutron-server restart重启记录警告
http://www.aboutyun.com/thread-14725-1-1.html





about云2015年08月12日每日一读


高吞吐量系统设计优化建议
http://www.aboutyun.com/thread-14718-1-1.html
1.开辟缓冲区的目的是什么?
2.缓冲区过大有什么缺点?
3.总结高吞吐量系统该如何优化?





机器学习API Top 10:AT&T Speech、IBM Watson和Google Prediction
http://www.aboutyun.com/thread-14710-1-1.html
1.机器学习10大API有哪些?
2.AT&T Speech有哪些特点、优势?
3.IBM Watson有哪些特点、优势?
4.Google Prediction有哪些特点、优势?
5.Wit.ai有哪些特点、优势?
6.AlchemyAPI有哪些特点、优势?
7.Diffbot有哪些特点、优势?
8.BigML有哪些特点、优势?
9.PredictionIO有哪些特点、优势?
10.Microsoft Azure Machine Learning有哪些特点、优势?
11.Amazon Machine Learning有哪些特点、优势?



为什么我是世界上最好的程序员?
http://www.aboutyun.com/thread-14711-1-1.html




资源:
UCloud DevOps Workshop—王津银(老王)
http://www.aboutyun.com/thread-14717-1-1.html


mapreduce应用偏移研究
http://www.aboutyun.com/thread-14719-1-1.html


白话虚拟化
http://www.aboutyun.com/thread-14720-1-1.html






问答:
Hmaster起不了,受伤
http://www.aboutyun.com/thread-14713-1-1.html


zookeeper 启动失败 BindException: Address already in use【解决办法】
http://www.aboutyun.com/thread-14715-1-1.html


hadoop  mapreduce如何实现多目录输出
http://www.aboutyun.com/thread-14716-1-1.html





为什么重启apache2以后Horizon页面没有发生任何变化2547200688@qq.com
http://www.aboutyun.com/thread-14704-1-1.html



弱弱的问句  hadoop2.x支持文件附加写操作吗?
http://www.aboutyun.com/thread-14705-1-1.html



hive 安装出现问题,各位帮忙看看
http://www.aboutyun.com/thread-14706-1-1.html


CDH5.2.6安装成功,hue无法启动
http://www.aboutyun.com/thread-14707-1-1.html


Load balancing Sink Processor相关问题
http://www.aboutyun.com/thread-14708-1-1.html



如何汇总
http://www.aboutyun.com/thread-14712-1-1.html




about云2015年08月11日每日一读



10EB量级的基因大数据处理技术
http://www.aboutyun.com/thread-14696-1-1.html
1.我们大脑为什么会这么强?大脑的处理能力有多强?
2.大数据的含义是什么?
3.环境对人有哪些影响?
4.造成人群差异的原因是什么?
5.为什么要做精准医学?



openstack【Kilo】入门 【dasboard篇】十八:添加dashboard
http://www.aboutyun.com/thread-14694-1-1.html
1.什么时候可以安装配置dasboard?
2.如何配置dasboard?
3.如何让配置生效?



豆瓣Redis解决方案Codis源码剖析:Dashboard
http://www.aboutyun.com/thread-14695-1-1.html
1.Dashboard涉及到哪些知识?
2.如何启动Dashboard?
3.什么是Slot?
4.如何初始化Slot?
5.数据迁移实现了哪些特性?
6.对于迁移中的Slot,如果恰好此时有客户端要访问该Slot中的某个Key该怎么办?


nutch2.2.1安装及遇到问题解决办法
http://www.aboutyun.com/thread-14698-1-1.html
1.nutch安装需要做哪些准备?
2.nutch安装包含哪些步骤?
3.安装过程中不兼容问题,是如何解决的?



阿里大数据观点【ppt】
http://www.aboutyun.com/thread-14700-1-1.html
1.本文将大数据分为了哪四层?
2.如何落地大数据?

3.本文中大数据在阿里的作用是什么?



资源:
Solr41运行算法
http://www.aboutyun.com/thread-14701-1-1.html


周东波-Docker与公有云
http://www.aboutyun.com/thread-14702-1-1.html



问答:
Hbase0.92.2 默认zookeeper 启动问题
http://www.aboutyun.com/thread-14697-1-1.html


openstack kilo 创建路由成功,但是出于停止状态【记录】
http://www.aboutyun.com/thread-14699-1-1.html







about云2015年08月10日每日一读

机器学习工作职位需要的7项技能
http://www.aboutyun.com/thread-14685-1-1.html
1.机器学习职位需要哪些技能呢?
2.机器学习岗位需要熟悉哪些编程语言?
3.需要掌握哪些命令和工具?



用Hadoop流实现mapreduce版推荐系统基于物品的协同过滤算法
http://www.aboutyun.com/thread-14686-1-1.html
1.mapreduce矩阵乘法是如何实现的?
2.本文如何改进,形成一个mapreduce?



Docker入门--命令使用详解
http://www.aboutyun.com/thread-14687-1-1.html
1.如何查看Docker命令?
2.如何显示 Docker 系统信息,包括镜像和容器数?
3.那个命令实现从本地移除一个或多个指定的镜像?





Azure HDInsight 和 Spark 大数据实战(一)
http://www.aboutyun.com/thread-14688-1-1.html
1.什么是HDInsight?
2.HDInsight 在两个平台上部署有什么区别?



Azure HDInsight 和 Spark 大数据实战(二)
http://www.aboutyun.com/thread-14689-1-1.html
1.在HDInsight如何安装 Spark?
2.如何在HDInsight运行 Spark?







为什么你应当将应用迁移到云服务上?
http://www.aboutyun.com/thread-14684-1-1.html
1.为什么要进行迁移?
2.你的应用是否能够经受住访问量突然空前增长的考验呢?
3.云服务如何降低成本?






2015年about云08月第2周
http://www.aboutyun.com/thread-14683-1-1.html



资源:

solr参考指南v3.5版本【397页】
http://www.aboutyun.com/thread-14690-1-1.html



solr参考指南【v4.0版本416页】
http://www.aboutyun.com/thread-14691-1-1.html


数据分析Kibana 中文指南
http://www.aboutyun.com/thread-14692-1-1.html




问答:


关于sbt打包运行
http://www.aboutyun.com/thread-14682-1-1.html





about云2015年08月09日每日一读


从公众平台分析,浅谈怎么做数据分析
http://www.aboutyun.com/thread-14676-1-1.html
1.数据分析有什么意义?
2.数据分析怎么统计?
3.数据分析展示方式有哪些?




以一当十的程序员不是传说
http://www.aboutyun.com/thread-14677-1-1.html




机器学习之实战朴素贝叶斯算法
http://www.aboutyun.com/thread-14671-1-1.html
1、了解贝叶斯分类、贝叶斯定理和朴素贝叶斯分类的概念以及历史发展,以及三者之间有何联系。
2、贝叶斯定理实现的关键是什么?
3、本文用MATLAB实现了实例来说明朴素贝叶斯算法
4、它们在计算机中有哪些应用?这个值得思考。



云计算与大数据技术推动物联网创新
http://www.aboutyun.com/thread-14672-1-1.html
1、阿里云业务全景有哪些?
2、阿里云自建CDN网络的安全性怎么样?
3、阿里云的物联网解决方案是什么?
4、DEDS承载车联网海量数据发展。
5、德澜物联网分为几部分?


Yarn的资源优化
http://www.aboutyun.com/thread-14673-1-1.html



设置hive map数量
http://www.aboutyun.com/thread-14674-1-1.html
1.增加map数量?
2.本文的思路是什么?



HDFS namenode 写edit log原理以及源码分析
http://www.aboutyun.com/thread-14675-1-1.html



资源:
LuceneInAction(第2版)_中文版【466页】
http://www.aboutyun.com/thread-14678-1-1.html


Solr 实战英文版【763页】
http://www.aboutyun.com/thread-14679-1-1.html


最新100份开源大数据架构论文汇总
http://www.aboutyun.com/thread-14670-1-1.html





about云2015年08月08日每日一读


详解整合Kafka到Spark Streaming【推荐】
http://www.aboutyun.com/thread-14664-1-1.html
1.input DStream的作用是什么?
2.spark、storm能否并行读取kafka?如何实现并行读取?
3.spark还存在哪些问题,新版本是否解决?


docker 构建 spark1.4镜像
http://www.aboutyun.com/thread-14665-1-1.html
1.docker 仓库如何实现 pull 镜像?
2.如何构建 docker 镜像?
3.docker build –rm -t sequenceiq/spark:1.4.0 . 含义是什么?


如何在IDEA 环境下打包spark源码提交到集群
http://www.aboutyun.com/thread-14666-1-1.html
1.在IDEA 环境下打包spark源码包含哪些步骤?
2.提交spark任务需要做哪些准备?




资源:

Apache.Solr.3.1.Cookbook英文书籍【300页】
http://www.aboutyun.com/thread-14668-1-1.html




分享两边Scala书籍,完整版的
http://www.aboutyun.com/thread-14663-1-1.html


Apache Solr实现更加灵巧的搜索
http://www.aboutyun.com/thread-14667-1-1.html








问答:

Storm消费topic的问题,求教
http://www.aboutyun.com/thread-14660-1-1.html




spark 怎么控制数输出文件个个数
http://www.aboutyun.com/thread-14654-1-1.html


关于hbase的jar包运行?
http://www.aboutyun.com/thread-14655-1-1.html



hadoop2.4.1 QJM ha集群namenode的edits log文件清除问题,求大神帮忙看看
http://www.aboutyun.com/thread-14656-1-1.html



求推荐学习数据挖掘的书籍
http://www.aboutyun.com/thread-14657-1-1.html



CDH 5.4 报错,求问有人遇到了么?
http://www.aboutyun.com/thread-14658-1-1.html


求一个用户画像的解决方案 使用hbase
http://www.aboutyun.com/thread-14659-1-1.html


hadoop提交任务后,到Running Job就卡住了
http://www.aboutyun.com/thread-14661-1-1.html










about云2015年08月07日每日一读


[Spark源码剖析] DAGScheduler划分stage
http://www.aboutyun.com/thread-14642-1-1.html
1、了解stage的相关知识点。
2、stage的产生和提交的步骤有哪些?
3、DAGScheduler如何划分stage?
4、shuffleToMapStage的key的含义是什么?key和value又是怎么确定的呢?



Scala学习(八)---Scala继承
http://www.aboutyun.com/thread-14646-1-1.html
1、Scala的继承与java的差异有哪些?
2、Scala继承如何更加简化代码量?



openstack【Kilo】入门 【网络篇】十七:创建实例
http://www.aboutyun.com/thread-14639-1-1.html
1.创建实例需要哪些条件?
2.创建实例使用的是哪个网络ID?
3.如何不安装dasboard,访问创建实例?



资源:
about云openstack入门宝典第四版_kilo版
http://www.aboutyun.com/thread-14650-1-1.html


Storm上运行SQL(日志分析)
http://www.aboutyun.com/thread-14652-1-1.html


Storm上运行SQL(滑动窗口)
http://www.aboutyun.com/thread-14651-1-1.html



问答:
Spark SQL如何实现多程序访问?
http://www.aboutyun.com/thread-14648-1-1.html





was连接zookeeper失败jaas
http://www.aboutyun.com/thread-14643-1-1.html



mr 如何实现 网站连续几日uv量统计
http://www.aboutyun.com/thread-14644-1-1.html


hive sum over分析函数结果不一样
http://www.aboutyun.com/thread-14645-1-1.html






about云2015年08月06日每日一读


openstack  kilo安装汇总:包括安装部署及遇到的问题总结
http://www.aboutyun.com/thread-14632-1-1.html

大数据的价值不在大,而在于潜在用户的挖掘
http://www.aboutyun.com/thread-14635-1-1.html
1.大数据思维是什么?
2.总结大数据与数据挖掘之间的关系?
3.广发银行为例,说明大数据的挖掘主要表现哪些方面?




SaaS多租户模式数据存储方案
http://www.aboutyun.com/thread-14633-1-1.html
1.本文对于SaaS多租户模式数据存储有几种方案?
2.独立数据库有什么优点?
3.共享数据架构和数据库有什么优点?



OpenStack Neutron 架构指南
http://www.aboutyun.com/thread-14630-1-1.html
1、分析了Neutron架构。
2、Neutron架构由3层构成,各层的功能是什么,最核心的是哪一层?
3、Linux环境下网络设备的虚拟化主要有哪几种形式?
4、Neutron RPC的主要功能是什么?
5、了解Neutron虚拟网络。





人工智能之梦
http://www.aboutyun.com/thread-14627-1-1.html
1、早期对人工智能的理解是什么样的?
2、后期的人工智能三大学派是什么?
3、人工智能近年来的新进展有哪些?




Google翻译是如何把深度学习“塞进”手机的?
http://www.aboutyun.com/thread-14625-1-1.html
1、字镜头是什么?
2、如何在手机上完成深度学习?




openstack网络模式之vlan分析
http://www.aboutyun.com/thread-14631-1-1.html
1、openstack neutron定义四种网络模式分别是什么?
2、Loca网络l模式是如何配置的?

3、Vlan网络模式是如何配置的?
4、Vlan网络模式的网络节点与计算节点比较。

在 CentOS 7.1 上安装分布式存储系统 Ceph
http://www.aboutyun.com/thread-14634-1-1.html
1.Ceph 提供哪3种存储方式?
2.Ceph 是否要求必须是奇数个监控节点?
3. Ceph需要哪些软件?



资源:
Spark大数据处理:技术、应用与性能优化(全)【397页】
http://www.aboutyun.com/thread-14636-1-1.html

企业云化的痛点与实践_方国伟_大型企业的基础架构演变V4.1_终稿
http://www.aboutyun.com/thread-14637-1-1.html





问答:

CDH启用kerberos后,前台浏览器登陆hdfs、solr等会报权限错误
http://www.aboutyun.com/thread-14626-1-1.html





about云2015年08月05日每日一读


【Java并发编程实战】—–synchronized
http://www.aboutyun.com/thread-14623-1-1.html
1.java同步机制解决了什么问题?
2.Java中synchronized关键字的作用是什么?
3.什么是锁?





openstack二次开发:如何定制自己(企业)openstack图标、标题等内容
http://www.aboutyun.com/thread-14620-1-1.html
1.如何修改dasboard网站颜色?
2.如何修改openstack dasboard网站标题?
3.如何定制自己的logo,及品牌连接?





数据分析、机器学习与物联网
http://www.aboutyun.com/thread-14612-1-1.html
1、什么是物联网?
2、怎样理解IOT能力?
3、数据分析和机器学习如何运用到物联网领域?




storm本地模式与集群模式的区别
http://www.aboutyun.com/thread-14615-1-1.html
1.storm本地模式和集群模式代码方面有什么区别?
2.如何终止storm拓扑?
3.Config.TOPOLOGY_DEBUG设置为true有什么作用?






金融行业的数据挖掘之道
http://www.aboutyun.com/thread-14611-1-1.html
1、如何针对客户意见建立本体模型?
2、如何使用朴素贝叶斯挖掘客户意见?


资源:

中国行业大数据应用市场专题研究报告
http://www.aboutyun.com/thread-14619-1-1.html


云上运维专题_王为_OpenStack中的高可用与分布式三层网络
http://www.aboutyun.com/thread-14621-1-1.html





问答:
HDFS适合每次只去读少量文件的业务吗
http://www.aboutyun.com/thread-14613-1-1.html



storm StormSubmitter.submitTopology问题
http://www.aboutyun.com/thread-14614-1-1.html


关于OpenStack Kilo版环境平台搭建时endpointj问题
http://www.aboutyun.com/thread-14616-1-1.html




Combiner
http://www.aboutyun.com/thread-14617-1-1.html



nutch 数据抓取问题
http://www.aboutyun.com/thread-14618-1-1.html


eclipes 生成jar包,运行出错
http://www.aboutyun.com/thread-14622-1-1.html





about云2015年08月04日每日一读


hbase 如何提交任务到集群
http://www.aboutyun.com/thread-14601-1-1.html


大数据云技术基础之Linux源:/etc/apt/sources.list文件
http://www.aboutyun.com/thread-14602-1-1.html
1./etc/apt/sources.list的作用是什么?
2.为什么会产生 /etc/apt/sources.list.d?
3.deb http://cn.archive.ubuntu.com/ubuntu/ precise main restricted中precise main restricted该如何解析?


各种Linux版本(ubuntu,centos,fedora)如何修改源
http://www.aboutyun.com/thread-14605-1-1.html
1.遇到什么问题会更换源?
2.ubuntu如何更换源?
3.三个Linux版本都是如何实现更新源的?



小知识:
openstack kilo安装 apt-get dist-upgrade的含义是什么?
http://www.aboutyun.com/thread-14603-1-1.html


ubuntu更换源【以openstack  kilo为例】
http://www.aboutyun.com/thread-14604-1-1.html


资源:
1-吴海鹏-Docker在持续集成服务中的实践
http://www.aboutyun.com/thread-14607-1-1.html


2-王磊-应用Docker相关技术实现容器即服务的探索与实践
http://www.aboutyun.com/thread-14608-1-1.html


NoSQL数据库笔谈v2
http://www.aboutyun.com/thread-14609-1-1.html





问答:
hive遇问题,以后解决暂时记录
http://www.aboutyun.com/thread-14606-1-1.html



求助!xshell连接不上用fuel部署的master虚拟机
http://www.aboutyun.com/thread-14593-1-1.html



图片存储,请问大家是怎么处理的?
http://www.aboutyun.com/thread-14594-1-1.html


hbase如何实现对图片的增删改查?
http://www.aboutyun.com/thread-14595-1-1.html


挂在卷的时候报错,挂载不上云盘
http://www.aboutyun.com/thread-14596-1-1.html


openstack kilo(ubuntu14.04 适用于其它版本)之安装ntp出现错误
http://www.aboutyun.com/thread-14597-1-1.html


Storm UI 中报的错颜色不一样,请问这有什么区别吗?
http://www.aboutyun.com/thread-14598-1-1.html



HDFS的shell操作
http://www.aboutyun.com/thread-14599-1-1.html


求教:如何在服务器端执行jar包执行hbase的增删改查操作
http://www.aboutyun.com/thread-14600-1-1.html





about云2015年08月03日每日一读

2015年about云8月第1周
http://www.aboutyun.com/thread-14588-1-1.html


计算机科学中最重要的32个算法
http://www.aboutyun.com/thread-14589-1-1.html
1.本文哪些算法是比较常见的?
2.什么是分支界定算法(Branch and Bound)?
3.什么是期望-最大算法?




程序员如何合理的管理时间碎片?
http://www.aboutyun.com/thread-14585-1-1.html
1.生活中会有很多的碎片时间,如何合理的应用呢?
2.项目中最浪费时间的事情是什么?
3.如何合理利用时间?


从机器学习谈起
http://www.aboutyun.com/thread-14586-1-1.html
1.什么是机器学习语言?
2.机器学习的范围有哪些?
3.机器学习里面究竟有多少经典的算法呢?
4.机器学习界大放光彩的经典算法是什么?
5.机器学习如何应用?
6.机器学习的子类是谁?
7.机器学习的父类是谁?




如何通过MapReduce实现腾讯QQ推荐好友
http://www.aboutyun.com/thread-14583-1-1.html


spark个人学习总结
http://www.aboutyun.com/thread-14584-1-1.html



资源:
大数据量化投资:研报文本挖掘选股策略
http://www.aboutyun.com/thread-14590-1-1.html


Openstack J版DVR搭建流程
http://www.aboutyun.com/thread-14591-1-1.html





问答:

求助!装好后的kilo版,为叙项目、管理员等栏目都无法展开
http://www.aboutyun.com/thread-14580-1-1.html


Hadoop-为大数据时代开启新的导航!Come On !
http://www.aboutyun.com/thread-14581-1-1.html



基于lucene的案例开发:纵横小说分布式采集
http://www.aboutyun.com/thread-14582-1-1.html


nutch 抓去失败
http://www.aboutyun.com/thread-14587-1-1.html






about云2015年08月02日每日一读


学习大数据、云技术如何提高部署学习效率
http://www.aboutyun.com/thread-14575-1-1.html
1.如何避免反复部署集群?
2.快照的作用是什么?
3.缓存服务器能起到什么作用?



每个程序员和设计师必做的10项运动
http://www.aboutyun.com/thread-14578-1-1.html




如何通过eclipse查看、阅读hadoop2.x(以hadoop2.4为例)源码
http://www.aboutyun.com/thread-14569-1-1.html
1.官网src包下载包,能否直接使用?
2.如何跟踪和查看hadoop源码?


R与python比较:帮助分析是R还是Python
http://www.aboutyun.com/thread-14572-1-1.html
1.pypi是什么?
2.R如何使用?
3.Python如何使用?



李滔:搜狐基于Spark的新闻和广告推荐实战
http://www.aboutyun.com/thread-14577-1-1.html





资源:

VMware规划设计最佳实践
http://www.aboutyun.com/thread-14573-1-1.html


可视化存储智能解决方案—思路、设计与展现(By-冬瓜头)
http://www.aboutyun.com/thread-14574-1-1.html




问答:

sqoop同步oracle数据到hbase效率低
http://www.aboutyun.com/thread-14566-1-1.html



启动hdfs时出现问题
http://www.aboutyun.com/thread-14567-1-1.html



openstack kilo版本heat安装问题 heat-keystone-setup-domain: command not found
http://www.aboutyun.com/thread-14570-1-1.html


hbase 安装问题
http://www.aboutyun.com/thread-14571-1-1.html


有关Raft算法中,leader 如何判断 earlier term 的某个 log entry 已经成功提交?
http://www.aboutyun.com/thread-14576-1-1.html




about云2015年08月01日每日一读



虚拟机是怎么实现的?
http://www.aboutyun.com/thread-14564-1-1.html
1.为什么产生虚拟机?
2.产生虚拟机有哪些好处?
3.有那么多个操作系统一起运行,内存是怎么管理的?
4.多个VM之间是怎么分享资源的?或者说,1GB内存怎么当2GB用?




通过Mesos、Docker和Go,使用300行代码创建一个分布式系统
http://www.aboutyun.com/thread-14561-1-1.html
1、Mesos、Docker和Go三者结合是如何用300行代码创建一个分布式系统?
2、1个Mesos框架由什么组成?
3、本文通过一个比特币开采系统来解释三者结合的高效性。



七牛是如何搞定每天500亿条日志的
http://www.aboutyun.com/thread-14563-1-1.html
1、Flume和Kafka使用要点有哪些?
2、数据离线和实时计算采用什么方法?
3、Flume+Kafka+Spark 结合起来是如何处理500亿条日志?




Hive静态分区、动态分区
http://www.aboutyun.com/thread-14558-1-1.html




资源:

Hbase配置及客户端远程访问Hbase设置
http://www.aboutyun.com/thread-14560-1-1.html




问答:
openstack kilo 安装部署奇怪的问题
http://www.aboutyun.com/thread-14562-1-1.html




启动hadoop失败,请帮忙看看(hdfs namenode -fornat)
http://www.aboutyun.com/thread-14557-1-1.html



【求助】已知zookeeper IP和端口号,能远程访问Hbase里的表吗?
http://www.aboutyun.com/thread-14559-1-1.html






about云2015年07月29日每日一读


为什么程序员也能成为伟大的CEO
http://www.aboutyun.com/thread-14512-1-1.html



KNN算法Hadoop实现及kaggle digit recognition数据测试
http://www.aboutyun.com/thread-14518-1-1.html
1.Hadoop实现KNN算法,如何设计mapper和reducer?
2.Mapper函数包含哪三个函数?
3.Combiner是如何设计的?




Hadoop参数汇总
http://www.aboutyun.com/thread-14507-1-1.html
1.如何表示文件描述符?
2.fs.trash.interval=0的含义是什么?
3.NN的RPC地址和端口是多少?




R语言是如何增强数据科学
http://www.aboutyun.com/thread-14517-1-1.html





资源:

presto-hadoop-summit
http://www.aboutyun.com/thread-14511-1-1.html



最新100份开源大数据架构论文之70:An introduction (and random notes) to Cascad...
http://www.aboutyun.com/thread-14515-1-1.html

最新100份开源大数据架构论文之71:Serializing Data with Protocol Buffers
http://www.aboutyun.com/thread-14516-1-1.html





问答:

hdfs namenode起不来
http://www.aboutyun.com/thread-14506-1-1.html



cloudera官网发布的hadoop跟一般的hadoop有什么区别?
http://www.aboutyun.com/thread-14509-1-1.html



Storm服务器程序运行不稳定。
http://www.aboutyun.com/thread-14513-1-1.html





about云2015年07月28日每日一读
HDFS Snapshot原理
http://www.aboutyun.com/thread-14495-1-1.html
1.快照的作用是什么?
2.HDFS Snapshot的原理是什么?





hadoop版本为2.4.0:Could not find the main class: org.apache.hadoop.hdfs.
http://www.aboutyun.com/thread-14490-1-1.html


impala学习总结
http://www.aboutyun.com/thread-14491-1-1.html
1、impala的哪两种分布式join方式?
2、topN有哪两个执行阶段?
3、如何解决YARN资源分配的响应时间过长?


Hadoop的Server及其线程模型分析
http://www.aboutyun.com/thread-14493-1-1.html
1.Listener线程的作用是什么?
2.Reader线程的唤醒时机有哪两个?



大数据的梦想与现实(上):大数据技术篇
http://www.aboutyun.com/thread-14502-1-1.html
1、传统BI的数据处理方式是怎样的?
2、大数据解决方案有哪几种?
3、大数据的市场行情如何?


大数据的梦想与现实(下):大数据的应用篇
http://www.aboutyun.com/thread-14503-1-1.html
1、大数据在国内主要集中在哪些行业?
2、国外的大数据行业运用情况如何?
3、国内产业大数据平台的发展机会有哪些?



资源:

最新100份开源大数据架构论文之68:Hortonworks Technical Preview for Apache Falcon
http://www.aboutyun.com/thread-14499-1-1.html



最新100份开源大数据架构论文之69:Simplifying Big Data with Apache Crunch
http://www.aboutyun.com/thread-14500-1-1.html










问答:
Solr,shards.tolerant=true的问题
http://www.aboutyun.com/thread-14492-1-1.html


Solr主备节点同时宕机的问题
http://www.aboutyun.com/thread-14494-1-1.html


storm  + kafka问题请教
http://www.aboutyun.com/thread-14496-1-1.html



如何迁移Clouder Manager Server到一个新的主机呢
http://www.aboutyun.com/thread-14497-1-1.html


Hadoop问答
http://www.aboutyun.com/thread-14498-1-1.html



regionserver 无法启动。。
http://www.aboutyun.com/thread-14501-1-1.html


eclipse 配置远程hadoop 2.6.0
http://www.aboutyun.com/thread-14486-1-1.html



如何通过cloudera manager开启回收站并设置删除时间
http://www.aboutyun.com/thread-14487-1-1.html



问一个Storm类加载的问题
http://www.aboutyun.com/thread-14488-1-1.html


hbase根据rowkey读取数据时间超过2秒
http://www.aboutyun.com/thread-14489-1-1.html




about云2015年07月22日每日一读


Hadoop Web项目--Friend Find系统(1)
http://www.aboutyun.com/thread-14409-1-1.html
1.Friend Find系统完成了什么事情?
2.项目运行做哪些准备?
3.项目实现包含哪些流程?
4.项目有哪些功能及实例原理是什么?



Hadoop Web项目--Friend Find系统(2)
http://www.aboutyun.com/thread-14411-1-1.html
1.本文执行聚类包括哪三个MR任务?
2.画决策图的作用是什么?
3.执行分类的思路是什么?




谈谈如何在面试中发掘程序猿的核心竞争力
http://www.aboutyun.com/thread-14410-1-1.html
1、如何在简历中体现自己的能力?
2、如何在笔试中体现自己的能力?
3、如何在面试中体现自己的能力?



怎样在初创公司里搭建稳定、可访问的数据基础架构
http://www.aboutyun.com/thread-14405-1-1.html


Myeclipse编译Maven项目并Tomcat部署
http://www.aboutyun.com/thread-14412-1-1.html
1.本文使用了哪些工具?
2.如何配置tomcat?
3.下载maven项目,如何导入Myeclipse?



一道hadoop面试题
http://www.aboutyun.com/thread-14413-1-1.html



【分布式计算】MapReduce的替代者-Parameter Server
http://www.aboutyun.com/thread-14414-1-1.html
1、什么是Parameter Server?
2、Map-Reduce是如何解决逻辑回归的?
3、Parameter Server的机制有哪些?







资源:

Apache Solr High Performance
http://www.aboutyun.com/thread-14415-1-1.html


openstack镜像制作指南
http://www.aboutyun.com/thread-14416-1-1.html



问答:
hadoop job -list RsvdMem这个字段表示什么
http://www.aboutyun.com/thread-14406-1-1.html


使用sqoop从hdfs将数据导入mySQL卡在100%不执行
http://www.aboutyun.com/thread-14407-1-1.html





about云2015年07月21日每日一读

图数据库中的高科技和高安全性
http://www.aboutyun.com/thread-14402-1-1.html
1.在设计系统时,安全是否需要考虑?
2.图数据库中三元组是什么?
3.当三元组的数量增加到数十亿的量级后,快速遍历多个路径就成为计算的瓶颈该如何解决?





最重要的事情,请在早上8点前完成
http://www.aboutyun.com/thread-14403-1-1.html



程序员什么时候该考虑辞职
http://www.aboutyun.com/thread-14389-1-1.html


已拿到offer 2015年腾讯暑期实习面试总结(技术岗)
http://www.aboutyun.com/thread-14401-1-1.html




资源:

炼数成金 JVM 视频
http://www.aboutyun.com/thread-14393-1-1.html




openstack命令汇总
http://www.aboutyun.com/thread-14397-1-1.html



最新100份开源大数据架构论文之61:mapreduce join
http://www.aboutyun.com/thread-14398-1-1.html


最新100份开源大数据架构论文之62:Apache Phoenix
http://www.aboutyun.com/thread-14399-1-1.html


最新100份开源大数据架构论文之63:Log Processing in mapreduce
http://www.aboutyun.com/thread-14400-1-1.html





问答:
openstack role add --project service --user nova admin角色添加重复错误
http://www.aboutyun.com/thread-14388-1-1.html



glance命令报“Request returned failure status 401. Invalid OpenStack Identity...
http://www.aboutyun.com/thread-14390-1-1.html



【求教】cinder后端对接ipsan则卷的鉴权以及登陆信息,nova如何获取
http://www.aboutyun.com/thread-14391-1-1.html



[求助]端口创建问题
http://www.aboutyun.com/thread-14392-1-1.html



CDH5.0.1配置map数量
http://www.aboutyun.com/thread-14395-1-1.html


【求助】hadoop2.X分布式搭建两个NameNode均无法正常启动
http://www.aboutyun.com/thread-14396-1-1.html




about云2015年07月20日每日一读


Spark生态和Spark架构
http://www.aboutyun.com/thread-14385-1-1.html
1.什么是Spark?
2.Spark生态系统包括哪些?
3.Spark的依赖有哪些?
4.了解Spark架构是怎样的?
5.Spark是如何运行的?
6.Spark架构有哪些组件?





基于mapreduce的5种计算框架介绍
http://www.aboutyun.com/thread-14377-1-1.html
1.什么是并行计算?
2.并行计算有哪两种类型?
3.Disco 运行 MapReduce 包含哪些步骤?


深度学习和经验主义的胜利
http://www.aboutyun.com/thread-14378-1-1.html
1.深度学习与监督学习是什么关系?
2.是什么让像深度学习这样的方法流行?
3.经验主义的作用是什么?



配置Spark源码阅读环境
http://www.aboutyun.com/thread-14374-1-1.html
1.SBT有哪些特性?
2.SBT构建的工程结构是什么样子的?
3.SBT有哪些命令?
4.如何导入Spark工程?
5.如何安装InteliJ IDEA的编辑器主题配色?


Spark的Standalone模式安装部署
http://www.aboutyun.com/thread-14375-1-1.html
1.Spark有哪些运行模式?
2.Spark Standalone集群模式是如何部署的?
3.Spark Client 是如何部署的?
4.spark Standalone伪分布式模式是如何部署的?


2015年about云7月第3周
http://www.aboutyun.com/thread-14380-1-1.html


资源:

云设计模式【英文版】
http://www.aboutyun.com/thread-14386-1-1.html



最新100份开源大数据架构论文之57:The Pig Experience
http://www.aboutyun.com/thread-14381-1-1.html



最新100份开源大数据架构论文之58:Hive - A Warehousing Solution Over a Map-Red...
http://www.aboutyun.com/thread-14382-1-1.html


最新100份开源大数据架构论文之59:Hive
http://www.aboutyun.com/thread-14383-1-1.html


最新100份开源大数据架构论文之60:Pig Latin
http://www.aboutyun.com/thread-14384-1-1.html









问答:

hadoop、spark日志分析工具
http://www.aboutyun.com/thread-14373-1-1.html


请问hadoop高可用,三台请zookeeper  怎么访问?
http://www.aboutyun.com/thread-14379-1-1.html





about云2015年07月19日每日一读


如何选择满足需求的SQL on Hadoop系统
http://www.aboutyun.com/thread-14363-1-1.html
1.实时交互式查询系统有哪些区别和优缺点?
2.Hive on Tez系统具备哪些优点?
3.Hive on Spark系统具备哪些优点?
4.Impala系统具备哪些优点?
5.Presto系统具备哪些优点?


揭秘:4种数据科学工作,8项求职技能
http://www.aboutyun.com/thread-14362-1-1.html
1.数据科学工作分为哪几种类型?
2.什么是数据科学家?
3.数据科学工作要具备哪些技能?



资源:

Hadoop实战 第2版
http://www.aboutyun.com/thread-14364-1-1.html



首发《Clojure数据分析秘笈》
http://www.aboutyun.com/thread-14365-1-1.html


Spark快速数据处理
http://www.aboutyun.com/thread-14366-1-1.html


Splunk大数据分析
http://www.aboutyun.com/thread-14367-1-1.html


Linux教程
http://www.aboutyun.com/thread-14369-1-1.html



问答:
在linux平台下启动intellij idea 14  报错
http://www.aboutyun.com/thread-14368-1-1.html







about云2015年07月18日每日一读



配置 OpenStack Keystone 支持企业内部的域特定目录服务
http://www.aboutyun.com/thread-14346-1-1.html
1.对于企业多个地方部署openstack,openstack是如何解决的?
2.多地企业目录本文是如何配置的?
3.openstack多域的含义是什么?有什么好处?




新浪是如何分析处理32亿条实时日志的?
http://www.aboutyun.com/thread-14347-1-1.html
1、新浪处理日志采用的技术框架有哪些?
2、为了提供更好的服务,新浪从哪些方面入手,以及是如何实现的?
3、在本文的问答环节,你有哪些收获?




美团面试中被问到的问题汇总
http://www.aboutyun.com/thread-14342-1-1.html


深度剖析CloudFoundry的架构设计
http://www.aboutyun.com/thread-14349-1-1.html
1、CloudFoundry的框架的总体结构。
2、CloudFoundry由哪几大组件构成,以及各组件的功能是什么?
3、想真正了解CloudFoundry,最好方法就是读它的源码。




资源:

最新100份开源大数据架构论文之56:druid
http://www.aboutyun.com/thread-14358-1-1.html


最新100份开源大数据架构论文之57:Fallacies-of-Distributed-Computing-Explained...
http://www.aboutyun.com/thread-14359-1-1.html


最新100份开源大数据架构论文之58:blinkdb_eurosys
http://www.aboutyun.com/thread-14360-1-1.html





问答:

谁知道openstack的各个组件里用到oslo_config是怎么读取.conf配置文件的
http://www.aboutyun.com/thread-14341-1-1.html


dfs.name.dir 与 dfs.data.dir都是什么含义
http://www.aboutyun.com/thread-14343-1-1.html


./storm supervisor  提示: Kill No Such process
http://www.aboutyun.com/thread-14344-1-1.html



openstack horizon的本地化开发
http://www.aboutyun.com/thread-14345-1-1.html


CDH5离线安装无法读取本地Parcel
http://www.aboutyun.com/thread-14351-1-1.html


HBase无法创建表
http://www.aboutyun.com/thread-14352-1-1.html


hbase为什么要检测节点直接的时间差异呢?
http://www.aboutyun.com/thread-14353-1-1.html


Hive实现wordCount程序
http://www.aboutyun.com/thread-14354-1-1.html



CDH5离线安装无法启动sqoop2
http://www.aboutyun.com/thread-14355-1-1.html


hadoop、spark有哪些好的运行结果分析工具?
http://www.aboutyun.com/thread-14356-1-1.html


请教,openstack命名规则
http://www.aboutyun.com/thread-14357-1-1.html








about云2015年07月17日每日一读


弹性分布式数据集RDD概述
http://www.aboutyun.com/thread-14329-1-1.html
1.什么是弹性分布式数据集RDD?
2.RDD有哪些特性?
3.RDD有哪些好处?
4.RDD有哪些编程接口?
5.RDD之间的依赖关系有哪些?
6.RDD是如何数据存储管理的?


10个用于Web开发的最好Python 框架
http://www.aboutyun.com/thread-14330-1-1.html
1、什么是python?
2、python的10大Web框架有哪些,以及它们各自的特点?
3、本文只是这10大框架做了简单介绍,让你对它们有个初步的了解?



RDD操作详解1——Transformation和Actions概况
http://www.aboutyun.com/thread-14331-1-1.html
1.Spark算子有什么作用?
2.Transformation具体包括哪些内容?
3.Actions具体包括哪些内容?
4.算子分为哪几类?



为什么私有云的定位应该是PaaS,而不是IaaS?
http://www.aboutyun.com/thread-14332-1-1.html
1、为什么选择私有PaaS而不是私有IaaS?
2、为什么基于Mesos构建私有PaaS?
3、DCOS如何让构建一个私有的PaaS相对简单?




Scala学习(七)---包和引入
http://www.aboutyun.com/thread-14333-1-1.html
1.Scala中的包和引入语句是如何工作的?
2.包如何像内部类那样嵌套?
3.引入语句如何重命名和隐藏特定成员?




新的可视化帮助更好地了解Spark Streaming应用程序
http://www.aboutyun.com/thread-14334-1-1.html
1、查看到底哪个spark job引起了这个批次的处理时间过长?
2、
Job用了两个stage和flatMap , map , reduceByKey 的作用是什么?
3、Spark1.5.0未来有什么新功能?




dfs.namenode.shared.edits.dir与dfs.name.dir区别
http://www.aboutyun.com/thread-14335-1-1.html



资源:
最新100份开源大数据架构论文之54:ryad
http://www.aboutyun.com/thread-14336-1-1.html


最新100份开源大数据架构论文之55:A Brief Introduction to Apache Tez
http://www.aboutyun.com/thread-14337-1-1.html


大数据处理与分析系列分享:大数据处理与分析概览--冯振华V1.1
http://www.aboutyun.com/thread-14338-1-1.html


半小时理解Neutron代码结构
http://www.aboutyun.com/thread-14339-1-1.html



问答:

openstack启动虚拟机出错:cannot stat /proc/sys/net/ipv4/ip_forward: Permissii
http://www.aboutyun.com/thread-14325-1-1.html

哪里有cloudfoundry内部运行流程、工作原理的资料呢
http://www.aboutyun.com/thread-14326-1-1.html

elasticsearch的template 可不可以向solr的schema.xml那样  维护在一个文件中。
http://www.aboutyun.com/thread-14327-1-1.html


CDH5.0.1与nutch的集成
http://www.aboutyun.com/thread-14328-1-1.html





about云2015年07月16日每日一读



史上最全的程序员求职渠道总结
http://www.aboutyun.com/thread-14315-1-1.html



开发者使用机器学习的十大诀窍
http://www.aboutyun.com/thread-14306-1-1.html

机器学习和统计模型的差异
http://www.aboutyun.com/thread-14308-1-1.html
1、什么是机器学习、统计模型?
2、从本文中的商业案例中理解统计模型和机器学习算法的差别
3、机器学习和统计模型的差异有哪些?

Hadoop MapReduce执行过程详解(带hadoop例子)
http://www.aboutyun.com/thread-14310-1-1.html
1.MapReduce是如何执行任务的?
2.Mapper任务是怎样的一个过程?
3.Reduce是如何执行任务的?
4.键值对是如何编号的?
5.实例,如何计算没见最高气温?


Hadoop之MapReduce自定义二次排序流程实例详解
http://www.aboutyun.com/thread-14311-1-1.html
1.如何解决MapReduce二次排序?
2.Map端如何处理?
3.Reduce端如何处理?
4.MapReduce二次排序是如何具体实现的呢?


解密京东618技术:重构多中心交易平台 11000个Docker支撑
http://www.aboutyun.com/thread-14313-1-1.html
1、京东618采用的技术有哪些?
2、京东如何在高强度的负载压力下,保证业务系统的平稳运行?
3、后端运营的核心是什么?
4、流量压测发现的瓶颈是什么?京东提出了怎样的解决方案?
5、交易系统的优化方案有哪些?


Scala学习(六)---Scala对象
http://www.aboutyun.com/thread-14314-1-1.html
1、apply方法的含义是什么?
2、Scala如何产出枚举类型?
3、Scala如何输出所有枚举值的集?



资源:

2015最新cassandra书籍
http://www.aboutyun.com/thread-14312-1-1.html

Thinking In Java(英文版 第四版)【1079】
http://www.aboutyun.com/thread-14320-1-1.html

HBase二级索引实现方案
http://www.aboutyun.com/thread-14321-1-1.html


最新100份开源大数据架构论文之52:Drill slides52
http://www.aboutyun.com/thread-14322-1-1.html


最新100份开源大数据架构论文之53:Impala A Modern, Open-Source SQL Engine for H.
http://www.aboutyun.com/thread-14323-1-1.html

问答:

HIVE配置完成后的一些错误
http://www.aboutyun.com/thread-14307-1-1.html

glance如何添加自定义api
http://www.aboutyun.com/thread-14309-1-1.html

为什么会连接不到neutron
http://www.aboutyun.com/thread-14316-1-1.html

ganglia的监控数据可以保存多长时间?
http://www.aboutyun.com/thread-14317-1-1.html

使用Maven构建hadoop项目
http://www.aboutyun.com/thread-14318-1-1.html

关于hadoop集群HA的问题,懂的进来下
http://www.aboutyun.com/thread-14319-1-1.html







about云2015年07月15日每日一读


新手福利:Apache Spark入门攻略
http://www.aboutyun.com/thread-14294-1-1.html
1、为什么要使用Apache Spark?
2、Spark如何工作?
3、如何安装Spark?
4、什么是弹性分布式数据集RDD?

程序员,为未来准备好了吗?
http://www.aboutyun.com/thread-14301-1-1.html



高并发系统中的常见问题
http://www.aboutyun.com/thread-14290-1-1.html
1、数据库层面的并发访问如何解决?
2、如何理解Memcached的CAS机制?
3、缓存访问是怎样解决计算型密集型任务?
4、如何解决单点峰值流量的性能瓶颈?


spark 安装部署详细文档
http://www.aboutyun.com/thread-14291-1-1.html
1、spark job的生成和运行是怎样的?
2、如何编译spark?
3、kafka和sparkstreaming怎样结合?


Linux必知的29个命令
http://www.aboutyun.com/thread-14300-1-1.html
1.ps命令是什么意思?
2.df命令的含义是什么?
3.uname会显示什么信息?





资源:

如何在Azure上安装cloudera hadoop
http://www.aboutyun.com/thread-14293-1-1.html

最新100份开源大数据架构论文之51:Interactive Analysis of Web-Scale Datasets
http://www.aboutyun.com/thread-14302-1-1.html



scala本质(2015)【英文】
http://www.aboutyun.com/thread-14303-1-1.html





问答:

普通的topology   spout  会有失败的情况
http://www.aboutyun.com/thread-14298-1-1.html


hbase有什么命令能看某个row存在哪个region吗?
http://www.aboutyun.com/thread-14299-1-1.html





我要申请azure区的版主
http://www.aboutyun.com/thread-14292-1-1.html

怎么用nova命令删除compute啊
http://www.aboutyun.com/thread-14295-1-1.html

求助 时间转换
http://www.aboutyun.com/thread-14296-1-1.html

求教 提交了任务java.io.IOException: Broken pipe
http://www.aboutyun.com/thread-14297-1-1.html







about云2015年07月14日每日一读


如何合理的控制solr查询的命中的数量和质量?
http://www.aboutyun.com/thread-14288-1-1.html
1.本文涉及全文检索中那两个概念?
2.众多结果中,排序的标准是什么?
3.如何合理的控制solr查询的命中的数量和质量?




hadoop学习之基础Java GC详解
http://www.aboutyun.com/thread-14276-1-1.html
1.HotSpot上的分代分为哪三个部分?
2.评估GC性能的指标有哪几个?
3.年老区和永久区使用的是什么算法?



hadoop2.7.1源码分析之自带mapreduce(wordcount)解析【最新最详细注释】
http://www.aboutyun.com/thread-14277-1-1.html
1.hadoop2.7.1是否支持多路径输入?
2.下面代码中包含几个泛型类?
3.如何区分输入与输出路径?



资源:

最新100份开源大数据架构论文之48:Storm @Twitter
http://www.aboutyun.com/thread-14283-1-1.html



最新100份开源大数据架构论文之49:ApacheSamza
http://www.aboutyun.com/thread-14284-1-1.html


最新100份开源大数据架构论文之50:sosp_spark_streaming
http://www.aboutyun.com/thread-14285-1-1.html


系统和网络管理
http://www.aboutyun.com/thread-14286-1-1.html


about云用户组审计
http://www.aboutyun.com/thread-14287-1-1.html







问答:

想深刻学习下hbase和hive看什么书好?
http://www.aboutyun.com/thread-14279-1-1.html




弱弱的问一句 jvm full gc到底是啥意思
http://www.aboutyun.com/thread-14274-1-1.html

mahout CardinalityException
http://www.aboutyun.com/thread-14275-1-1.html

新人求助开发
http://www.aboutyun.com/thread-14278-1-1.html



hadoop书籍推荐
http://www.aboutyun.com/thread-14280-1-1.html


intellij Idea老出现Error:scalac: IO error while decoding
http://www.aboutyun.com/thread-14281-1-1.html


jps显示the command is not found
http://www.aboutyun.com/thread-14282-1-1.html




about云2015年07月13日每日一读


about云源码分析之hadoop2.x(2.7.1为例)二次开发基础:命令行添加
http://www.aboutyun.com/thread-14259-1-1.html
1.Apache Commons CLI 如何被定义?
2.CLI 命令代码实现流程是什么?
3.Options 类的作用是什么?

about云源码分析之hadoop2.x(2.7.1为例)二次开发:hadoop是如何定义命令行的
http://www.aboutyun.com/thread-14260-1-1.html

about云源码分析之hadoop2.7.1  mapreduce(wordcount为例)新写法
http://www.aboutyun.com/thread-14258-1-1.html



about云2015年07月第二周经典回顾
http://www.aboutyun.com/thread-14266-1-1.html




银行业和游戏业的技术体系架构
http://www.aboutyun.com/thread-14265-1-1.html
1.金融系统企业架构有哪些特性?
2.在云端构建的架构中应该考虑具备什么样的主要非功能特性?
3.银行业和游戏业的技术体系架构有哪些优劣势?


平庸程序员的各种迹象
http://www.aboutyun.com/thread-14264-1-1.html
1.平庸程序员有哪些表现?
2.无法从集合的角度思考有哪些特征?哪些补救措施?
3.缺乏批判性思维有哪些特征?哪些补救措施?
4.弹球式编程有哪些特征?哪些补救措施?
5.不熟悉安全原则有哪些特征?哪些补救措施?
6.代码一塌糊涂有哪些特征?哪些补救措施?



Intellij IDEA该如何设置忽略部分类编译错误
http://www.aboutyun.com/thread-14267-1-1.html
1.如何设置Intellij IDEA忽略部分类编译错误?
2.为什么要在Intellij IDEA中使用Eclipse编译器?
3.为什么Intellij IDEA设置忽略部分类编译错误?





Windows Azure 系列-- Azure Redis Cache的配置和使用
http://www.aboutyun.com/thread-14261-1-1.html
1.如何配置Azure Power Shell?
2.Azure Power Shell如何添加账户?
3.New-AzureManagedCache -Name mycache -Location "South Central US" -Sku Basic -Memory 128MB命令的含义是什么?



资源:

最新100份开源大数据架构论文之47:图形处理系统47
http://www.aboutyun.com/thread-14271-1-1.html

最新100份开源大数据架构论文之46:图形处理系统
http://www.aboutyun.com/thread-14270-1-1.html


OpenStack实战指导手册
http://www.aboutyun.com/thread-14269-1-1.html

CDH5.3离线安装指南
http://www.aboutyun.com/thread-14268-1-1.html







about云2015年07月12日每日一读



about云hadoop源码分析之mapredue的泛型类解析【hadoop2.7.1】
http://www.aboutyun.com/thread-14243-1-1.html
1.什么是泛型?
2.什么是泛型接口类?
3.Mapper<Object, Text, Text, IntWritable>是一个什么类?


about云hadoop源码分析之如何获取任务名字及进度【hadoop2.7.1】
http://www.aboutyun.com/thread-14245-1-1.html
1.你认为如何获取hadoop mapreduce任务名字?
2.你认为如何获取hadoop mapreduce?


about云hadoop源码分析之mapredue字符串分解StringTokenizer用法【hadoop2.7.1】
http://www.aboutyun.com/thread-14249-1-1.html
1.map中StringTokenizer字符串是如何分割的?
2.StringTokenizer如何判断是否还有字符串?
3.nextToken()的作用是什么?





openstack融合hadoop项目Sahara【juno、 kilo新增】
http://www.aboutyun.com/thread-14255-1-1.html
1.OpenStack Sahara是什么?
2.OpenStack Sahara作用是什么?
3.总结openstack与hadoop的关系是什么?

从零教你如何获取hadoop2.X源码并使用eclipse关联hadoop2.X源码
http://www.aboutyun.com/thread-14244-1-1.html
1.如何通过官网src包,获取hadoop的全部代码
2.通过什么样的操作,可以查看hadoop某个函数或则类的实现?
3.maven的作用是什么?

Scala学习---映射和元组
http://www.aboutyun.com/thread-14246-1-1.html
1.如何构造映射?
2.如何在映射中取值?
3.如何更改键值?
4.如何迭代映射?
5.映射如何排序?
6.Scala和java是怎么相互操作的?
7.如何定义、获取元组?
8.拉链是怎样操作?


背后 :数据能干什么,值得我们好好思考
http://www.aboutyun.com/thread-14248-1-1.html
1.什么是数据?
2.如何利用用户的声音来进行业务决策?
3.如何走近每一层的规模?

openstack kilo 更新源总是遇到失败
http://www.aboutyun.com/thread-14252-1-1.html

资源:

OpenStack 架构设计指南【20150711】
http://www.aboutyun.com/thread-14254-1-1.html

openstack kilo 最新文档汇总
http://www.aboutyun.com/thread-14253-1-1.html


快学scala、scala编程pdf完整版
http://www.aboutyun.com/thread-14242-1-1.html

《hadoop in practice》很好的一本书
http://www.aboutyun.com/thread-14219-1-1.html



问答:

重启计算节点 nova service-list 显示异常
http://www.aboutyun.com/thread-14256-1-1.html

强行关机,现在集群的主节点起不了服务,该怎样解决
http://www.aboutyun.com/thread-14250-1-1.html

为什么我的hadoop一次只能执行一个job
http://www.aboutyun.com/thread-14251-1-1.html








about云2015年07月11日每日一读

hadoop2.7.1(稳定版)汇总:安装包、源码包、API、新能功能及改变
http://www.aboutyun.com/thread-14234-1-1.html




HDFS小文件处理解决方案总结
http://www.aboutyun.com/thread-14227-1-1.html
1、HDFS处理小文件有几种方案?各自的优缺点有哪些?
2、HDFS文件操作流程步骤有哪些?
3、你对提高HDFS处理小文件的效率有什么新的想法?


编程经验分享:函数要多小才够好——谈小函数之道
http://www.aboutyun.com/thread-14236-1-1.html



hadoop2.7.1发布
http://www.aboutyun.com/thread-14225-1-1.html

storm-starter在Intellij IDEA IDE下调试分析classNot found【推荐】
http://www.aboutyun.com/thread-14230-1-1.html
1.本文遇到问题是如何分析的?
2.classNot found的原因是什么?
3.如何解决classNot found?


资源:

离散数学及其应用下载
http://www.aboutyun.com/thread-14240-1-1.html

最新100份开源大数据架构论文之43:spark pregel_paper
http://www.aboutyun.com/thread-14237-1-1.html

最新100份开源大数据架构论文之44:Large Scale Graph Processing with Apache Giraph
http://www.aboutyun.com/thread-14238-1-1.html

最新100份开源大数据架构论文之45:spark graphx
http://www.aboutyun.com/thread-14239-1-1.html

问答:

安装集群监控ganglia遇到问题
http://www.aboutyun.com/thread-14228-1-1.html


构造 storm topology 时需要依赖第三方jar包,这些jar包需要上传Nimbus吗?
http://www.aboutyun.com/thread-14229-1-1.html

hive一个神奇问题,求助!
http://www.aboutyun.com/thread-14231-1-1.html

新手求指导。使用hadoop-eclipse-plugin执行MR程序和使用hadoop jar命令有区别吗
http://www.aboutyun.com/thread-14232-1-1.html





about云2015年07月10日每日一读


about云订阅
http://www.aboutyun.com/thread-14212-1-1.html

about云系列spark入门5:MLlib 介绍
http://www.aboutyun.com/thread-14183-1-1.html

about云系列spark入门6:GraphX 介绍
http://www.aboutyun.com/thread-14220-1-1.html



通过可视化来了解你的Spark应用程序
http://www.aboutyun.com/thread-14218-1-1.html
1.spark可视化带来的提升主要包括哪三个部分?
2.时间轴视图可以覆盖哪3个等级?
3.Spark events时间轴视图反映了哪些内容?


通过devstack自动部署Openstack icehouse 版本
http://www.aboutyun.com/thread-14213-1-1.html
1.devstack自动部署Openstack需要做哪些准备?
2.devstack有哪些文件?
3. localrc配置文件有哪些配置项?


Redis主从配置和HA配置
http://www.aboutyun.com/thread-14215-1-1.html
1.Redis Replication的特点和优势有哪些?
2.Redis主从如何配置?
3.RedisHA本文是如何配置的?



资源:

openstack测试要点
http://www.aboutyun.com/thread-14221-1-1.html

最新100份开源大数据架构论文之42:Parallel Data Processing with MapReduce A Sur...
http://www.aboutyun.com/thread-14222-1-1.html

最新100份开源大数据架构论文之43:MapReduce Simplied Data
http://www.aboutyun.com/thread-14223-1-1.html

问答:

新人求指路:如果我想装几台机器玩hadoop应该从哪儿入手啊
http://www.aboutyun.com/thread-14211-1-1.html

openstack volumes error
http://www.aboutyun.com/thread-14214-1-1.html

关于生产环境中flume启动命令的问题,请路过的大神看一看~
http://www.aboutyun.com/thread-14216-1-1.html






about云2015年07月09日每日一读

软件开发者的四大“看家本事”
http://www.aboutyun.com/thread-14199-1-1.html
1.本文讲了哪四大技能?
2.你认为该如何具备这四种技能?
3.除了本文涉及技能,你认为还需要哪些技能?


学习hadoop2.7 API:通过eclipse反编译hadoop2.7 包及 wordcount例子
http://www.aboutyun.com/thread-14200-1-1.html
1.反编译hadoop2.7 jar包需要哪些插件?
2.如何将反编译插件安装到eclipse中?
3.如何获取hadoop 包源码,及hadoop2.7 wordcount?


程序员要有持续产出
http://www.aboutyun.com/thread-14198-1-1.html


资源:

概率论与数理统计(浙大四版)
http://www.aboutyun.com/thread-14208-1-1.html

最新100份开源大数据架构论文之40:Fast and Interactive Analytics over Hadoop NE.
http://www.aboutyun.com/thread-14206-1-1.html

最新100份开源大数据架构论文之41:Analytics Platform
http://www.aboutyun.com/thread-14207-1-1.html



小知识:

Linux下eclipse运行mapreduce问题记录【hadoop2.7】
http://www.aboutyun.com/thread-14194-1-1.html

spark yarn cpu配置一些说明
http://www.aboutyun.com/thread-14202-1-1.html

问答:

为什么我的hbase启动老不成功,HMaster自己突然消失了
http://www.aboutyun.com/thread-14193-1-1.html


hbase1.0 与hive1.2整合 java.lang.NoSuchMethodError: setDurability
http://www.aboutyun.com/thread-14195-1-1.html

求大神 为hadoop job -list 看不到Job呢 --Hadoop 2.4
http://www.aboutyun.com/thread-14196-1-1.html

eclipse开发hbase程序时报错,该怎样解决
http://www.aboutyun.com/thread-14197-1-1.html

hbase有哪些二级索引解决方案
http://www.aboutyun.com/thread-14201-1-1.html

spark RDD Transformations和Actions区别是什么?
http://www.aboutyun.com/thread-14203-1-1.html

spark有哪些概念
http://www.aboutyun.com/thread-14204-1-1.html

Mahout FastByIdMap 例子
http://www.aboutyun.com/thread-14205-1-1.html







about云2015年07月08日每日一读


最牛B的编码套路
http://www.aboutyun.com/thread-14184-1-1.html
1.本文编码套路是什么?
2.为什么天天编程,不足以成为专业程序员?
3.程序员该如何锻炼成为专业程序员?

Scala学习(三)----数组相关操作
http://www.aboutyun.com/thread-14174-1-1.html
1、使用一个长度不变的数组,可以用Scala中的Array?
2、对于长度按需要变化的数组,Scala中的等效数据结构为?
3、在Scala中如何全遍历数组?

能在编程之路走得更远的迹象
http://www.aboutyun.com/thread-14181-1-1.html

Scala学习(五)---Scala中的类
http://www.aboutyun.com/thread-14182-1-1.html
1、什么是“统一访问原则”?
2、如何使用@BeanProperty注解?
3、怎样理解Scala的构造器?









资源:

Shell_教程系列汇总
http://www.aboutyun.com/thread-14190-1-1.html

最新100份开源大数据架构论文之37:The Part-Time Parliament
http://www.aboutyun.com/thread-14186-1-1.html

最新100份开源大数据架构论文之38:paxos-simple
http://www.aboutyun.com/thread-14187-1-1.html

最新100份开源大数据架构论文之39:The Chubby lock service for loosely-coupled d...
http://www.aboutyun.com/thread-14188-1-1.html

最新100份开源大数据架构论文之36:ZooKeeper:Wait-free coordination
http://www.aboutyun.com/thread-14185-1-1.html

大数据时代的技术变革和IT人的挑战
http://www.aboutyun.com/thread-14189-1-1.html


问答:

hive运行job的时候报错
http://www.aboutyun.com/thread-14172-1-1.html

storm epl 有玩过的吗?
http://www.aboutyun.com/thread-14173-1-1.html

hive load data 能够不动源数据吗?
http://www.aboutyun.com/thread-14175-1-1.html


kafka删除节点怎么删除啊
http://www.aboutyun.com/thread-14177-1-1.html

hive创建mapreduce 为0个。有详细日志。求分析为何原因?
http://www.aboutyun.com/thread-14178-1-1.html

hbase的Hregionserver 不定期的dead
http://www.aboutyun.com/thread-14179-1-1.html

Shell代码规范
http://www.aboutyun.com/thread-14180-1-1.html

关于map和reduce
http://www.aboutyun.com/thread-14169-1-1.html

hadoop-2.7.0 启动hdfs出错?
http://www.aboutyun.com/thread-14170-1-1.html

Hadoop集群中HDFS 存储数据块的讨论
http://www.aboutyun.com/thread-14171-1-1.html




about云2015年07月07日每日一读


如何反编译hadoop2.x(2.7为例)安装包自带wordcount
http://www.aboutyun.com/thread-14156-1-1.html
1.如何查看hadoop带自带例子源码?
2.本文使用的什么工具进行反编译?
3.hadoop2.7如何实例化job的?

Linux中如何安装eclipse
http://www.aboutyun.com/thread-14160-1-1.html
1.如何从window复制到Linux?
2.如何在Linux中安装eclipse?
3.如何创建快捷方式?



about云系列spark入门4:Spark Streaming介绍
http://www.aboutyun.com/thread-14158-1-1.html
1.spark Streaming支持哪些语言?
2.spark Streaming是否具有故障恢复功能?

SOLR检索调试
http://www.aboutyun.com/thread-14147-1-1.html
1.如何进入优化分词器?
2.直接检索无法出结果问题该如何分析?
3.部分匹配无法出结果问题原因是什么?

ubuntu下terminal快捷键
http://www.aboutyun.com/thread-14148-1-1.html
1.如何通过鼠标移动terminal?
2.Ctrl + Alt + D的作用是什么?
3.如何取消最大化窗口?

Cassandra 3.0 的新特性介绍: 物化视图
http://www.aboutyun.com/thread-14162-1-1.html
1、如何使用物化视图?
2、哪些情况不能使用物化视图?


资源:

hadoop2.6 window下eclipse开发hadoop需要添加的组件
http://www.aboutyun.com/thread-14155-1-1.html




小知识:
hadoop集群安装重启后,找不到namenode进程
http://www.aboutyun.com/thread-14149-1-1.html

linux [] 使用或中括号使用
http://www.aboutyun.com/thread-14150-1-1.html

Hive的left join、left outer join和left semi join三者的区别
http://www.aboutyun.com/thread-14151-1-1.html

Call From host to host:9000 failed on connection exception: java.net.ConnectE..
http://www.aboutyun.com/thread-14152-1-1.html

eclipse 插件端口都是如何填写
http://www.aboutyun.com/thread-14154-1-1.html


问答:

Cloudera-Manager 添加新节点失败
http://www.aboutyun.com/thread-14153-1-1.html


devstack如何关闭
http://www.aboutyun.com/thread-14157-1-1.html

两个Node HBASE,Regionserver自动退出,总提示outofmemory问题
http://www.aboutyun.com/thread-14159-1-1.html

刚在虚拟机上装hadoop2.7.0,这样的结果是对的吗?
http://www.aboutyun.com/thread-14163-1-1.html




about云2015年07月06日每日一读


about云系列spark入门2:spark最新源码包、安装包、git源码、maven等下载介绍
http://www.aboutyun.com/thread-14137-1-1.html
1.spark安装包如何下载?
2.如何git下载源码包?
3.如果通过maven下载spark?


about云系列spark入门3:Spark SQL处理结构化数据的spark模块
http://www.aboutyun.com/thread-14141-1-1.html
1.在spark程序中,如何使用spark sql?
2.spark对于不同的数据源是如何处理的?
3.spark sql是否支持 JDBC 和 ODBC?






招聘初级程序员必须考虑的6个因素
http://www.aboutyun.com/thread-14136-1-1.html
1.招聘初级程序员需要考虑哪几个因素?
2.初级程序员基础知识是否扎实?
3.初级程序员是否具备解决问题的能力?
4.初级程序员是否具有沟通和表达能力?


HBase在线数据备份
http://www.aboutyun.com/thread-14135-1-1.html
1.Hbase备份能解决哪些问题?
2.Hbase在线备份有哪几种方式?
3.Hbase在线备份方案有哪些区别?
4.Hbase如何部署?

about云2015年07月第一周经典回顾
http://www.aboutyun.com/thread-14140-1-1.html

资源:

Scala编程(中文版)
http://www.aboutyun.com/thread-14145-1-1.html

Shell_教程系列29:cgi 脚本
http://www.aboutyun.com/thread-14142-1-1.html

最新100份开源大数据架构论文之33:Hadoop Fair Scheduler Design Document
http://www.aboutyun.com/thread-14143-1-1.html

最新100份开源大数据架构论文之34:Job Scheduling for Multi-User MapReduce Clus
http://www.aboutyun.com/thread-14144-1-1.html

问答:

虚拟机网络问题
http://www.aboutyun.com/thread-14134-1-1.html

集群增加节点出错
http://www.aboutyun.com/thread-14138-1-1.html






about云2015年07月05日每日一读


about云推出大数据hadoop生态系统零基础学习视频
http://www.aboutyun.com/thread-14119-1-1.html

从零开始,成为数据科学“大咖”
http://www.aboutyun.com/thread-14125-1-1.html

大数据+物体【大数据的最大价值】
http://www.aboutyun.com/thread-14121-1-1.html

HBase数据存储格式
http://www.aboutyun.com/thread-14131-1-1.html
1.HBase使用了哪种数据结构?
2.HFile分为哪六个部分?
3.StoreFile格式是哪种?


机器学习即服务之BigML特性介绍和入门教程
http://www.aboutyun.com/thread-14120-1-1.html
1、BigMl提供了一个什么样的管理平台?
2、BigML有哪些特性?
3、如何导入数据?
4、数据集是否可重复、可扩展、可导出?
5、什么是BigML决策树?
6、如何提高预测准确度?
7、如何评估结果?


小知识:

hive如何实现并发
http://www.aboutyun.com/thread-14130-1-1.html

Solrj创建索引和搜索的一般步骤
http://www.aboutyun.com/thread-14123-1-1.html

Solr如何加入中文分词
http://www.aboutyun.com/thread-14124-1-1.html

mac运行spark 1.4 -shell时遇到hostname错误
http://www.aboutyun.com/thread-14132-1-1.html


资源:

about云hadoop零基础入门基础篇【虚拟机、Linux、Java知识补充】
http://www.aboutyun.com/thread-14126-1-1.html

about云openstack零基础入门视频
http://www.aboutyun.com/thread-14127-1-1.html

最新100份开源大数据架构论文之31:Mesos 一个细粒度的资源在数据中心共享平台
http://www.aboutyun.com/thread-14128-1-1.html

最新100份开源大数据架构论文之32:capacity_scheduler
http://www.aboutyun.com/thread-14129-1-1.html

Scala Collections 提示和技巧
http://www.aboutyun.com/thread-14122-1-1.html





about云2015年07月04日每日一读


Redis系统入门介绍
http://www.aboutyun.com/thread-14112-1-1.html
1.Redis数据类型有哪些?
2.本文使用Redis完成哪些功能?
3.Redis中什么是散列类型?



YARN集群资源管理所面临的挑战【讨论】
http://www.aboutyun.com/thread-14113-1-1.html

Hadoop可视化分析利器之Hue
http://www.aboutyun.com/thread-14108-1-1.html
1.什么是Hue?
2.Hue的作用是什么?
3.如何配置Hue?




CDH5.2+CM5.2+impala2+Spark1.1集群搭建基础环境准备
http://www.aboutyun.com/thread-14105-1-1.html
1、集群搭建需要哪些准备工作?
2、CM5.2 YUM源如何搭建?
3、impala2 YUM 源如何搭建?
4、Mysql如何安装配置?

Solr5.1.0如何安装部署?
http://www.aboutyun.com/thread-14106-1-1.html
1.什么是Solr?
2.如何安装、管理Solr?



CDH 5.2中Impala认证集成LDAP和Kerberos
http://www.aboutyun.com/thread-14107-1-1.html
1、Impala认证组件的使用场景有哪些?
2、如何使用Kerberos?
3、如使用LDAP?






资源:

R语言编程艺术【312页】
http://www.aboutyun.com/thread-14117-1-1.html

最新100份开源大数据架构论文之29:提供可扩展的,交互式服务高可用的存储
http://www.aboutyun.com/thread-14114-1-1.html

最新100份开源大数据架构论文之30:about云谷歌的全球分布式数据库
http://www.aboutyun.com/thread-14115-1-1.html

Shell_教程系列28:运行级别脚本
http://www.aboutyun.com/thread-14116-1-1.html




问答:

Hadoop2.7.0与Centos6.4版版本冲突问题
http://www.aboutyun.com/thread-14109-1-1.html

sink往hdfs能汇集一定量的数据再向hdfs写吗
http://www.aboutyun.com/thread-14110-1-1.html

hive数据紊乱问题
http://www.aboutyun.com/thread-14104-1-1.html







about云2015年07月03日每日一读


浅谈深度学习技术及其应用
http://www.aboutyun.com/thread-14096-1-1.html
1.什么是深度学习?
2.深度学习的发展到了什么程度?
3.深度学习的优势是什么?



Hadoop配置LDAP集成Kerberos
http://www.aboutyun.com/thread-14089-1-1.html
1.环境配置要求有哪些及环境的配置?
2.如何进行对客户端的配置?
3.如何配置Hive集成的LDAP?
4.如何配置Impala集成的LDAP?


苏宁张小斌:OpenStack实践基础知识(三)
http://www.aboutyun.com/thread-14090-1-1.html
1.Openstack仍然会给企业带来的问题是什么?
2.构建在IaaS上的Openstack能做些什么?
3.Openstack的创新点该如何走下去?
4.如何规范、适合的使用Openstack?


Dropbox邵铮:我怎么看Hadoop Summit 2015和Spark Summit 2015?
http://www.aboutyun.com/thread-14092-1-1.html
1.Hadoop和Spark的大会规模如何?
2.Hadoop和Spark的发展趋势如何?
3.该如何去学习这两个热门技术?


Sahara顺利毕业,将加速OpenStack与Hadoop的融合
http://www.aboutyun.com/thread-14093-1-1.html
1.什么是Sahara?
2.Sahara是什么架构?


大数据对商业的影响
http://www.aboutyun.com/thread-14081-1-1.html


hive 任务调度
http://www.aboutyun.com/thread-14082-1-1.html

资源:

最新100份开源大数据架构论文之27:Near Real-Time, Scalable Data Warehousing
http://www.aboutyun.com/thread-14097-1-1.html

最新100份开源大数据架构论文之28:YARN一个资源管理器
http://www.aboutyun.com/thread-14098-1-1.html

Shell_教程系列27:几个脚本例子
http://www.aboutyun.com/thread-14099-1-1.html

数据挖掘实操
http://www.aboutyun.com/thread-14100-1-1.html

问答:

map任务运行节点
http://www.aboutyun.com/thread-14091-1-1.html

HDFS追加文件操作 debug日志,为什么会有这些日志输出?
http://www.aboutyun.com/thread-14086-1-1.html

Hive 插入数据时提示权限不够
http://www.aboutyun.com/thread-14087-1-1.html

Ceph 三节点安装配置
http://www.aboutyun.com/thread-14088-1-1.html

hadoop虚拟机网络问题
http://www.aboutyun.com/thread-14094-1-1.html

在Hive上面建表之后,再次登录show tables没有??
http://www.aboutyun.com/thread-14095-1-1.html






about云2015年07月02日每日一读

程序员获取新编程技能的5个技巧?
http://www.aboutyun.com/thread-14075-1-1.html



用 Ganglia 监控基于 Biginsights 的 HBase 集群性能
http://www.aboutyun.com/thread-14074-1-1.html
1.BigInsights和HBase的区别有哪些?
2.Ganglia如何部署?



shell中${ }使用
http://www.aboutyun.com/thread-14057-1-1.html

Shell 中的{} 和()
http://www.aboutyun.com/thread-14059-1-1.html





资源:
最新100份开源大数据架构论文之25:MongoDB_Architecture_Guide
http://www.aboutyun.com/thread-14076-1-1.html

最新100份开源大数据架构论文之26:Apache CouchDB
http://www.aboutyun.com/thread-14077-1-1.html

Shell_教程系列26:shell 工具
http://www.aboutyun.com/thread-14078-1-1.html

数据挖掘__R语言实战书籍下载【305页】
http://www.aboutyun.com/thread-14079-1-1.html

centos7.1安装openstack-kilo详细步骤
http://www.aboutyun.com/thread-14069-1-1.html

ubuntu14.04安装配置openstack-juno步骤
http://www.aboutyun.com/thread-14070-1-1.html


问答:

关于nova和swift的问题
http://www.aboutyun.com/thread-14064-1-1.html

swift搭建时使用演练疑问
http://www.aboutyun.com/thread-14068-1-1.html

CDH集群配置openldap问题
http://www.aboutyun.com/thread-14058-1-1.html

storm logviewer进程启开后,通过端口访问不到日志内容
http://www.aboutyun.com/thread-14060-1-1.html

storm logviewer 通过ui 访问不到日志链接
http://www.aboutyun.com/thread-14061-1-1.html

ganglia怎么扩展插件
http://www.aboutyun.com/thread-14062-1-1.html

请问openstack里面有关于MapReduce的接口或者模块吗
http://www.aboutyun.com/thread-14063-1-1.html

怎么能在map端两个文件统计完后,在进行reduce端处理
http://www.aboutyun.com/thread-14071-1-1.html

关于mapreduce哈希分区
http://www.aboutyun.com/thread-14072-1-1.html

低版本hadoop集群上的mapreduce能操作高版本hadoop集群上的HBase吗?
http://www.aboutyun.com/thread-14073-1-1.html








about云2015年07月01日每日一读


about云系列spark入门1:初步介绍及相关文档、安装包、例子、spark库等初步介绍
http://www.aboutyun.com/thread-14046-1-1.html
1.spark速度快的原因是什么?
2.spark有哪些组件?
3.spark可以使用哪些开发语言?

OpenStack在小米私有云平台的实践
http://www.aboutyun.com/thread-14039-1-1.html
1.如何选择块存储?
2.操作系统的选择是什么?
3.如何实现的对象存储?


是时候给糟糕的技术面试来场革命了
http://www.aboutyun.com/thread-14049-1-1.html

hbase问题总结及解决办法
http://www.aboutyun.com/thread-14036-1-1.html





Redis有序集内部实现原理分析(二)
http://www.aboutyun.com/thread-14048-1-1.html
1、什么是Redis跳表?
2、跳表插入操作如何实现?

资源:
Fast Data Processing with Spark(spark快速处理数据)书籍下载【英文】
http://www.aboutyun.com/thread-14054-1-1.html

Shell_教程系列25:第25章深入讨论<<
http://www.aboutyun.com/thread-14051-1-1.html

最新100份开源大数据架构论文之23:Bigtable 一个分布式结构化存储系统
http://www.aboutyun.com/thread-14052-1-1.html

最新100份开源大数据架构论文之24:Hypertable架构概述
http://www.aboutyun.com/thread-14053-1-1.html

spark大数据平台
http://www.aboutyun.com/thread-14042-1-1.html

问答:

求助:用mapreduce处理数据 ,有些数据本身的原因会出异常,怎么知道是哪些数据出异常了
http://www.aboutyun.com/thread-14044-1-1.html

linux定时任务 shell编写。求大神出山!
http://www.aboutyun.com/thread-14045-1-1.html

类似ganglia的系统监测工具有哪些?
http://www.aboutyun.com/thread-14047-1-1.html

求助beeline无法加载表
http://www.aboutyun.com/thread-14050-1-1.html

关于最新100份开源大数据架构论文
http://www.aboutyun.com/thread-14037-1-1.html

solr索引文件 segments_N文件丢失
http://www.aboutyun.com/thread-14038-1-1.html

keystone安装出现OpenStack授权失败问题
http://www.aboutyun.com/thread-14040-1-1.html

nova删不掉实例ERROR: Cannot 'forceDelete' while instance is in vm_state active
http://www.aboutyun.com/thread-14041-1-1.html

关于storm吞吐量
http://www.aboutyun.com/thread-14043-1-1.html






about云2015年06月30日每日一读


推荐系统开发的十个关键点
http://www.aboutyun.com/thread-14025-1-1.html
1.推荐系统使用了哪些技术?
2.用户行为数据,细分为哪两部分?
3.多模型融合技术使用了哪些具体技术?

程序员的幸福年代:中国科技人才薪酬直逼硅谷
http://www.aboutyun.com/thread-14022-1-1.html

未来,语音识别可能应用于哪些商业化场景?
http://www.aboutyun.com/thread-14020-1-1.html
1.本文列举了哪些领域?
2.语音识别在医疗领域发挥哪些作用?
3.如何应用于智能可穿戴领域?


离线安装Cloudera Manager5.3.4与CDH5.3.4(一)
http://www.aboutyun.com/thread-14024-1-1.html
1、前期准备工作有哪些?
2、如何安装与配置Cloudera Manager Server?
3、如何安装Agent?

离线安装Cloudera Manager5.3.4与CDH5.3.4(二)
http://www.aboutyun.com/thread-14029-1-1.html
1、如何制作本地源?
2、如何安装CDH?
3、怎么样检查Hue?


Linux命令行的艺术(使用各种命令总结)
http://www.aboutyun.com/thread-14010-1-1.html
1.本文列举了哪些日常使用命令?
2.文件及数据处理使用了哪些命令?
3.系统调试涉及哪些命令?



hbase shell和java编程分别 获取一行多版本的值
http://www.aboutyun.com/thread-14017-1-1.html
1.hbase对同一条数据的修改或插入是否都是put操作?
2.如何区别不同版本的数据?
3.如何看到旧版本数据?


hive1.1.0查询遇到问题分析及解决办法
http://www.aboutyun.com/thread-14019-1-1.html
1.对于sql语句遇到的问题,本文是如何调试的?
2.hive.optimize.remove.identity.project=false的作用是什么?
3.hive如何远程debug?






资源:

最新100份开源大数据架构论文之20:DAmazons的高可用 Key-value存储
http://www.aboutyun.com/thread-14031-1-1.html

最新100份开源大数据架构论文之21:Cassandra - A Decentralized Structured Storag...
http://www.aboutyun.com/thread-14032-1-1.html

最新100份开源大数据架构论文之22:Serving Large-scale Batch Computed Data with
http://www.aboutyun.com/thread-14033-1-1.html

Sinaweibopy:新浪微博Python SDK
http://www.aboutyun.com/thread-14018-1-1.html

about云8-mysql安装
http://www.aboutyun.com/thread-14027-1-1.html

about云9-RabbitMQ 安装
http://www.aboutyun.com/thread-14028-1-1.html

Shell_教程系列24:shell嵌入命令
http://www.aboutyun.com/thread-14030-1-1.html



问答:

如何修改:openstack 中 nova boot 创建实例只能在10个以内的限制
http://www.aboutyun.com/thread-14034-1-1.html

Hbase负载均衡问题!帮忙看看
http://www.aboutyun.com/thread-14021-1-1.html

关于swift存储方式的问题
http://www.aboutyun.com/thread-14011-1-1.html

ssh: connect to host h2 port 22: No route to host
http://www.aboutyun.com/thread-14012-1-1.html


求助,关于hbase的versions问题
http://www.aboutyun.com/thread-14015-1-1.html

openvswitch报错 求助!!
http://www.aboutyun.com/thread-14016-1-1.html

ssh的问题
http://www.aboutyun.com/thread-14026-1-1.html




about云2015年06月29日每日一读


如何使用分层存储,让 HDFS 变得更高效?
http://www.aboutyun.com/thread-13997-1-1.html
1.HDFS分层存储是如何工作的?
2.如何基于数据使用频率来优化大数据存储?
3.eBay是如何分层存储的?

如何在IDE中使用Docker
http://www.aboutyun.com/thread-13996-1-1.html
1.如何集成Docker到IDE中?
2.为什么要把Docker放进必须的开发工具列表中?
3.IDE如何集成Docker?
4.介绍什么是doclipser?

Scala学习(一)--Scala基础学习实践
http://www.aboutyun.com/thread-13998-1-1.html
1.res变量是val还是var?
2.Scala是否允许你用数字去乘字符串?
3.10 max 2的含义是什么?


Scala学习(二)--- 控制结构和函数
http://www.aboutyun.com/thread-14000-1-1.html
1.在Scala中,是否所有构造出来的语法结构都有值?
2.分号是不是必须的?
3. void类型是否是Unit?
4.Scala是否使用return?


about云2015年06月第四周经典回顾
http://www.aboutyun.com/thread-14001-1-1.html

小知识:

Sqoop处理Clob与Blob字段
http://www.aboutyun.com/thread-14008-1-1.html

资源:

浙大数据挖掘视频教程(28讲)
http://www.aboutyun.com/thread-14007-1-1.html

最新100份开源大数据架构论文之18:批处理框架和mapreduce在线计算18
http://www.aboutyun.com/thread-14004-1-1.html

最新100份开源大数据架构论文之19:大型数据管理系统的研究数据应用
http://www.aboutyun.com/thread-14005-1-1.html

Shell_教程系列23:023-调试脚本
http://www.aboutyun.com/thread-14006-1-1.html


问答:

hive中UDF 怎么没有出来结果,截图附上
http://www.aboutyun.com/thread-13994-1-1.html

hive --service hiveserver2 启动报错
http://www.aboutyun.com/thread-13995-1-1.html

MapReduce程序都无法执行
http://www.aboutyun.com/thread-13999-1-1.html

neutron 搭建完成后 无法ping通 router gateway
http://www.aboutyun.com/thread-14002-1-1.html

Lustre系统怎么进行分布式安装
http://www.aboutyun.com/thread-14003-1-1.html





about云2015年06月28日每日一读

如何成为一名真正专业的程序员
http://www.aboutyun.com/thread-13984-1-1.html

产品数据管理
http://www.aboutyun.com/thread-13986-1-1.html
1.产品数据管理是什么?
2.互联网的产品数据管理包括哪四大方面?
3.衡量一个产品的好坏有哪些指标?


Scala学习(一)--Scala基础学习
http://www.aboutyun.com/thread-13992-1-1.html
1.如何启动Scala解释器?
2.如何声明值和变量?
3.Scala有哪些基本数据类型?

Solr云(SolrCloud)
http://www.aboutyun.com/thread-13982-1-1.html
1.了解什么是SolrCloud?
2.SolrCloud在集群中如何使用?
3.SolrCloud两个片集群启动后是什么样的?

Neutron DVR实现multi-host特性打通东西南北流量提前看(by quqi99)
http://www.aboutyun.com/thread-13983-1-1.html
1.l3-agent的工作原理是什么?
2.L2是如何设计的?
3.L3(IR)是如何设计的?
4.DNAT是怎么设计的?
5.SNAT是如何设计的?
6.使用linux bridge时如何针对网络上出现多个相当IP的网关的ebtables隔离?



资源:

最新100份开源大数据架构论文之14:RCFile快速高效的数据分布,基于MapReduce的..
http://www.aboutyun.com/thread-13987-1-1.html

最新100份开源大数据架构论文之15:Apache Hive的主要技术
http://www.aboutyun.com/thread-13988-1-1.html

最新100份开源大数据架构论文之16:在Hadoop上压缩算法综述
http://www.aboutyun.com/thread-13989-1-1.html

最新100份开源大数据架构论文之17:XORing Elephants大数据的纠删码
http://www.aboutyun.com/thread-13990-1-1.html

Shell_教程系列22:-创建屏幕输入
http://www.aboutyun.com/thread-13991-1-1.html

小知识:
hadoop学习总结
http://www.aboutyun.com/thread-13985-1-1.html

问答:

Neutron Multi-host部署
http://www.aboutyun.com/thread-13980-1-1.html

虚拟机之间文件复制慢
http://www.aboutyun.com/thread-13981-1-1.html





about云2015年06月27日每日一读


大型网站架构体系的演变
http://www.aboutyun.com/thread-13972-1-1.html

成功部署物联网项目的10个需要考虑的问题
http://www.aboutyun.com/thread-13973-1-1.html
1.你认为部署物联网需要注意哪些问题?
2.本文涉及哪些问题?
3.你认为物联网如何与大数据、云技术相结合?

稳定模式在RESTful架构中的应用
http://www.aboutyun.com/thread-13978-1-1.html
1.保持分布式稳定性的方式有哪些?
2.分布式系统中保持网络稳定有哪五种方式?
3.服务器端断路器如何实现?

Kafka Consumer开发的一些关键点
http://www.aboutyun.com/thread-13977-1-1.html
1.Kafka的开发工具有哪些?
2.SimpleConsumer使用包含哪些步骤?

Zookeeper帮助Hadoop解决的问题
http://www.aboutyun.com/thread-13974-1-1.html

资源:

杜克大学 Python 计算统计学免费电子书
http://www.aboutyun.com/thread-13970-1-1.html

机器学习中文版
http://www.aboutyun.com/thread-13971-1-1.html

最新100份开源大数据架构论文之13:Column-Stores与Row-Stores区别是什么
http://www.aboutyun.com/thread-13976-1-1.html

Shell_教程系列21:第21章创建屏幕输出
http://www.aboutyun.com/thread-13975-1-1.html



问答:

在hadoop测试map如都测的代码,报java.io.IOExceptionType mismatch in key fro
http://www.aboutyun.com/thread-13962-1-1.html

Hive 插入数据错误
http://www.aboutyun.com/thread-13963-1-1.html

虚拟机中的数据如何存储到swift中
http://www.aboutyun.com/thread-13964-1-1.html

请问phoenix,能把原来hbase中有的表加载进来吗?
http://www.aboutyun.com/thread-13965-1-1.html

关于openstack虚拟机自动迁移问题
http://www.aboutyun.com/thread-13966-1-1.html

openstack compute启动报错 在线等
http://www.aboutyun.com/thread-13967-1-1.html

swift _member_组成员没有权限,怎么给该组成员添加权限
http://www.aboutyun.com/thread-13968-1-1.html

KeyValueTextInputFormat
http://www.aboutyun.com/thread-13969-1-1.html




about云2015年06月26日每日一读


Tachyon:Spark生态系统中的分布式内存文件系统
http://www.aboutyun.com/thread-13949-1-1.html
1.Tachyon是什么?
2.Tachyon是如何设计的?
3.Tachyon在百度内部是如何使用的?


akka actor的运行原理
http://www.aboutyun.com/thread-13957-1-1.html
1.如何配置Dispatcher?
2.Dispatcher的工作原理是什么?  
      

深入理解并行编程-分割和同步设计(一)
http://www.aboutyun.com/thread-13948-1-1.html
1.哲学家就餐问题,有哪些解决方案?
2.哲学家就餐与并发是什么关系?


深入理解并行编程-分割和同步设计(二)
http://www.aboutyun.com/thread-13958-1-1.html
1.分割策略的同样方法有哪些?
2.双端队列的争议是什么?
3.分割策略的争议是什么?



基于Cloudera Manager5配置HIVE压缩
http://www.aboutyun.com/thread-13945-1-1.html
1.基于HIVE命令行如何实现HIVE压缩?
2.基于xml文件的压缩需要做哪些修改?
3.Cloudera Manager5配置HIVE压缩如何配置?







问答:
hive表乱码
http://www.aboutyun.com/thread-13959-1-1.html

hadoop+hbase运行时总是任务失败
http://www.aboutyun.com/thread-13960-1-1.html

hadoop处理体检数据
http://www.aboutyun.com/thread-13941-1-1.html

有人用过这个配置mapreduce.tasktracker.local.dir.minspacekill 吗?
http://www.aboutyun.com/thread-13942-1-1.html

hadoop编程,跟写普通的java程序一样吗?
http://www.aboutyun.com/thread-13943-1-1.html

有没有好的Hadoop分析工具?
http://www.aboutyun.com/thread-13944-1-1.html

Hbase修改表名
http://www.aboutyun.com/thread-13947-1-1.html



资源:
深入理解并行编程V1.0
http://www.aboutyun.com/thread-13950-1-1.html

Shell_教程系列19:第19章shell 函数
http://www.aboutyun.com/thread-13951-1-1.html

Shell_教程系列20:第20章向脚本传递参数
http://www.aboutyun.com/thread-13952-1-1.html


最新100份开源大数据架构论文之九:09Ceph A Scalable, High-Performance Distribu
http://www.aboutyun.com/thread-13953-1-1.html

最新100份开源大数据架构论文之十:10The Google File System
http://www.aboutyun.com/thread-13954-1-1.html

最新100份开源大数据架构论文之11:The Hadoop Distributed File System
http://www.aboutyun.com/thread-13955-1-1.html

最新100份开源大数据架构论文之12:THE HADOOP DISTRIBUTED FILE
http://www.aboutyun.com/thread-13956-1-1.html




about云2015年06月25日每日一读

推荐系统在视频网站中的应用
http://www.aboutyun.com/thread-13936-1-1.html
1.视频网站的推荐系统有哪几类?
2.推荐系统有哪些方法?
3推荐系统的框架及其作用有哪些?


Facebook的深度学习系统可造出以假乱真的图像
http://www.aboutyun.com/thread-13938-1-1.html

重磅 深入浅出之数据型产品
http://www.aboutyun.com/thread-13934-1-1.html
1.数据产品有何来由?
2.数据产品的特征有哪些?
3.数据产品和大数据有哪些关系?


Scala中的对象
http://www.aboutyun.com/thread-13927-1-1.html
1.Scala中有没有静态方法或静态字段,以及如何实现这种功能?
2.什么是伴生对象,它的特点是什么?
3.apply方法的特点是什么?

Scala中的类
http://www.aboutyun.com/thread-13926-1-1.html
1.Scala如何定义一个类?
2.Scala中字段和getter/setter间有什么样的关系?
3.什么是辅助构造器?


小知识:图解 HDFS 工作原理
http://www.aboutyun.com/thread-13925-1-1.html

问答:
Hbase的Region和HDFS的Block之间的关系?
http://www.aboutyun.com/thread-13924-1-1.html

关于租户网络自管理(就是自己弄一个面板管理租户网络)
http://www.aboutyun.com/thread-13922-1-1.html

求助openstack创建云主机500错误
http://www.aboutyun.com/thread-13921-1-1.html

hbase高并发操作问题
http://www.aboutyun.com/thread-13920-1-1.html

network节点连通性问题
http://www.aboutyun.com/thread-13918-1-1.html


资源:

Shell_教程系列十八::第18章控制流结构
http://www.aboutyun.com/thread-13932-1-1.html

Pro Apache Hadoop
http://www.aboutyun.com/thread-13937-1-1.html

hadoop、hbase、hive、zookeeper版本对应关系续(最新版)
http://www.aboutyun.com/thread-13935-1-1.html

商品推荐算法&推荐解释
http://www.aboutyun.com/thread-13933-1-1.html

最新100份开源大数据架构论文之八:SQL-on-Hadoop08
http://www.aboutyun.com/thread-13931-1-1.html

最新100份开源大数据架构论文之七:contributed articles07
http://www.aboutyun.com/thread-13930-1-1.html

最新100份开源大数据架构论文之六:benchmarks-sigmod06
http://www.aboutyun.com/thread-13929-1-1.html

最新100份开源大数据架构论文之五:CAP
http://www.aboutyun.com/thread-13928-1-1.html








about云2015年06月24日每日一读

5亿整数的大文件,怎么排?
http://www.aboutyun.com/thread-13904-1-1.html
1.遇到数量巨大文件时该如何排序?
2.经典算法是否适用于大数量的文件排序?
3.外部排序是如何处理这种问题的?



Apache Hadoop准实时数据处理的架构模式
http://www.aboutyun.com/thread-13908-1-1.html
1.本文分为哪四种流处理模式?
2.什么是流采集?
3.基于外部环境的准实时事件处理与准实时基于外部环境的分割化的事件处理区别是什么?



开发人员写博客的七个理由
http://www.aboutyun.com/thread-13911-1-1.html

Apache Solr 之 使用SolrJ操作索引库
http://www.aboutyun.com/thread-13902-1-1.html
1.什么是Solrj?
2.Solrj可以用来做什么?
3.Solr索引,包括添加、更新、删除和查询等是如何实现的?

SolrCloud使用教程、原理介绍
http://www.aboutyun.com/thread-13903-1-1.html
1.何为SolrCloud?
2.如何配置SolrCloud?
3.
SolrCloud有哪些API?

mapreduce创建solrcloud索引
http://www.aboutyun.com/thread-13905-1-1.html
1.mapreduce创建solrcloud索引数据源是什么?
2.map函数的作用是什么?
3.reduce作用是什么?


Docker 1.7.0 发布深度解析新增功能
http://www.aboutyun.com/thread-13906-1-1.html
1.Docker 1.7.0新增加了哪些功能?
2.容器磁盘IO改进带来了哪些好处?
3.容器与宿主机共享UTS命名空间的支持带来哪些好处?

探索C#之微型MapReduce
http://www.aboutyun.com/thread-13897-1-1.html
1.Map是如何实现的?
2.Reduce是如何实现的?
3.如何支持分布式的?


OpenStack实践基础知识(二)
http://www.aboutyun.com/thread-13898-1-1.html
1.OpenStack的使用成本和团队学习成本如何?
2.学习 OpenStack需要哪些储备知识?
3.有没有线上使用的成功案例?
4.OpenStack安装部署和设置对于初级用户来说有什么建议?
5.将OpenStack应用到企业生产环境,需要考虑哪些?需要如何准备?
6.虚拟机的HA(至少主流版本没有)有好的建议或已有方案?

SolrJ不同版本使用教程
http://www.aboutyun.com/thread-13900-1-1.html
1.Solr3.x版本与Solr4.x版本有什么区别?
2.Solr3.x版本与Solr4.x版本在插入数据和查询数据方面有什么区别?
3.SolrCloud又是如何实现的?



小知识:
小知识分享:Maven 跳过test的命令
http://www.aboutyun.com/thread-13901-1-1.html

zookeeper配置文件详解
http://www.aboutyun.com/thread-13909-1-1.html

ZooKeeper创建一个与服务器的连接
http://www.aboutyun.com/thread-13910-1-1.html

问答:

java如何读取zookeeper地址ip以及监听的端口
http://www.aboutyun.com/thread-13907-1-1.html

大神们帮忙看下这是否正常?
http://www.aboutyun.com/thread-13894-1-1.html

solrcloud implicitdocrouter 如何指定shard
http://www.aboutyun.com/thread-13895-1-1.html

新手求教,在运行一个wordcount 提示如下错误,请帮忙看看什么问题
http://www.aboutyun.com/thread-13899-1-1.html

资源:
最新100份开源大数据架构论文之一:Conquering Big Data with BDAS
http://www.aboutyun.com/thread-13913-1-1.html

最新100份开源大数据架构论文之二:Summingbird A Framework for Integrating Batc
http://www.aboutyun.com/thread-13914-1-1.html

最新100份开源大数据架构论文之三:Scalable SQL and NoSQL Data Stores
http://www.aboutyun.com/thread-13916-1-1.html

最新100份开源大数据架构论文之四:Scalable SQL and NoSQL Data Stores
http://www.aboutyun.com/thread-13915-1-1.html

Shell_教程系列7:017-条件测试
http://www.aboutyun.com/thread-13912-1-1.html






about云2015年06月23日每日一读

about云2015年06月第三周经典回顾
http://www.aboutyun.com/thread-13884-1-1.html

分布式存储系统事务时序
http://www.aboutyun.com/thread-13874-1-1.html
1、单机场景下是否存在时序问题?
2、多机场景下如何满足Linearizability?
3、如何没有TrueTime,怎么做到Linearizability?

怎样利用Spark Streaming和Hadoop实现近实时的会话连接
http://www.aboutyun.com/thread-13883-1-1.html
1、怎么设置Spark Streaming?
2、如何实现字符串解析?
3、怎样产生sessions?


制作openstack所使用的centos6.5镜像
http://www.aboutyun.com/thread-13877-1-1.html
1.制作centos6.5镜像包含哪些过程?
2.如何压缩镜像?
3.安装cloud-init后,需要做哪些操作?

在Windows上编译hadoop cdh5.4
http://www.aboutyun.com/thread-13878-1-1.html
1.cmake安装有什么需要注意的地方?
2.编译hadoop cdh5.4需要哪些软件,版本分别是哪些?
3.通过什么命令可以编译hadoop cdh5.4?

Linux环境获取(cpu、内存、网卡流量等)系统性能数据
http://www.aboutyun.com/thread-13879-1-1.html
1.如何查看CPU利用率?
2.进程CPU利用率如何查看?
3.内存利用率需要查看哪个文件?

Linux Shell编程几则
http://www.aboutyun.com/thread-13880-1-1.html
1.在Shell中如何获取制定进程的CPU和内存占用量?
2.Shell中的浮点如何计算?

about云每日一读汇总(第九篇2015.06.21)
http://www.aboutyun.com/thread-13872-1-1.html

redis debug命令介绍
http://www.aboutyun.com/thread-13875-1-1.html
1.下面介绍了哪些debug命令?
2.总结debug的作用是什么?

小知识:

Build Spark1.3.1 with CDH HADOOP
http://www.aboutyun.com/thread-13876-1-1.html

一次网络超时的 Debug 过程
http://www.aboutyun.com/thread-13881-1-1.html


资源:

hadoop系列:入门hadoop ppt
http://www.aboutyun.com/thread-13888-1-1.html

Shell_教程系列15:第15章引号
http://www.aboutyun.com/thread-13886-1-1.html

Shell_教程系列16:基础shell编程
http://www.aboutyun.com/thread-13887-1-1.html

问答:

刚装的cdh,datanode全部启动不了。
http://www.aboutyun.com/thread-13882-1-1.html

听说应届生很难找到hadoop相关的工作?
http://www.aboutyun.com/thread-13873-1-1.html




about云2015年06月22日每日一读


SDN交换机在云计算网络中的应用场景
http://www.aboutyun.com/thread-13864-1-1.html
1.SDN交换机在云计算网络中有哪些应用场景?
2.云计算数据中心里面,是否所有的服务器都虚拟化了?
3.使用硬件SDN交换机接入硬件防火墙会带来哪些问题?

哪个行业应该更多地投资在大数据上?
http://www.aboutyun.com/thread-13865-1-1.html
1.哪个行业在大数据中花费最多?
2.大数据中花费最多的行业,他们有什么特点?
3.电信,旅游相关,高科技还有银行/金融服务高于其它行业的原因是什么?


微博广告推荐中有关Hadoop的那些事
http://www.aboutyun.com/thread-13869-1-1.html
1.如何高效得从如此规模的数据集中挖掘出有价值的信息?
2.如何在超大计算了的情况下进行超准计算?
3.如何解决hdfs在hadoop上面传输时候的低效率问题?



Hadoop常见错误及解决办法汇总
http://www.aboutyun.com/thread-13870-1-1.html
1.java.io.IOException: Incompatible clusterIDs错误原因,以及如何解决?
2.org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start container
错误原因,以及如何解决?
3.
java.net.SocketTimeoutException: 480000 millis timeout while waiting for channel to be ready for write错误原因,以及如何解决?
4.
DataXceiver error processing WRITE_BLOCK operation错误原因,以及如何解决?
5.
java.io.IOException: Failed to replace a bad datanode on the existing pipeline due to no more good datanodes being available to try.
错误原因,以及如何解决?
6.
org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directory for错误原因,以及如何解决?

用Python实现各种排序算法
http://www.aboutyun.com/thread-13861-1-1.html
1.使用python如何实现各种排序?
2.本文是如何实现的?

Redis源码速览
http://www.aboutyun.com/thread-13862-1-1.html
1.Redis源码如何编译和测试?
2.randget命令的作用是什么?
3.Redis中列表的存储方式有哪两种?



7款很棒的 HTML5 视频播放器
http://www.aboutyun.com/thread-13863-1-1.html
1.本文讲了哪七款HTML5 视频播放器?
2.支持全屏,在不支持的浏览器自动切换为 Flash 播放,属于那款浏览器?
3.非免费浏览器有哪些?




资源:

Shell_教程系列13:第13章登录环境
http://www.aboutyun.com/thread-13866-1-1.html

Shell_教程系列14:014-变量
http://www.aboutyun.com/thread-13867-1-1.html

Apache Flume Distributed Log Collection for Hadoop(英文版)
http://www.aboutyun.com/thread-13868-1-1.html

about云7-openstack环境准备-NTP安装
http://www.aboutyun.com/thread-13858-1-1.html


问答:

安装cdh5.4.2版本出现报错问题,求解答
http://www.aboutyun.com/thread-13859-1-1.html

apache kms
http://www.aboutyun.com/thread-13860-1-1.html









about云2015年06月21日每日一读

京东618:Docker扛大旗,弹性伸缩成重点
http://www.aboutyun.com/thread-13855-1-1.html
1.弹性云计算给京东带来了什么好处?
2.Docker的使用场景?
3.如何结合Docker和OpenStack?
4.缓存组件也跑在Docker中,这样做有什么好处?


强人工智能基本问题:全局控制与自组织
http://www.aboutyun.com/thread-13848-1-1.html
1.什么是全局控制人工神经网络算法?
2.本文是如何阐述自组织系统的?
3.自组织的系统有什么特点?


强人工智能:抑制神经元的意义
http://www.aboutyun.com/thread-13849-1-1.html
1.什么是抑制神经元?
2.抑制神经元的意义是什么?
3.抑制神经元是如何产生的?

Hadoop的集群数据、mapreduce管理及安全机制介绍
http://www.aboutyun.com/thread-13850-1-1.html
1.经常执行HDFS文件系统检查工具有哪些?
2.设置元数据与数据的存储路径都有哪些属性?
3.一旦数据发生异常,该如何保护集群,让NameNode为只读模式?
4.hadoop自带哪两种安全机制?

谱聚类(spectral clustering)
http://www.aboutyun.com/thread-13851-1-1.html
1.什么是聚类算法?
2.什么是谱聚算法?
3.谱聚算法的原理是什么?


资源:

Shell_教程系列12:tr用法
http://www.aboutyun.com/thread-13856-1-1.html

移动互联网:talkingdata-数据报告
http://www.aboutyun.com/thread-13852-1-1.html

python进价篇
http://www.aboutyun.com/thread-13854-1-1.html

移动互联网:尔雅物云wifi简介
http://www.aboutyun.com/thread-13853-1-1.html


问答:

keystone 服务问题 启动之后一会就自动停了,这个怎么解决,急!
http://www.aboutyun.com/thread-13845-1-1.html

flume 可以sink到本地文件目录么
http://www.aboutyun.com/thread-13846-1-1.html

















已有(8)人评论

跳转到指定楼层
longchao 发表于 2015-6-28 13:02:09
mark,thanks for sharing!
回复

使用道具 举报

Sheep0.0 发表于 2015-7-2 16:16:44
回复

使用道具 举报

long_ac 发表于 2015-7-9 15:43:50
都是干货呀
回复

使用道具 举报

crazyfish1986 发表于 2015-7-15 23:35:19
汇总得好,歇息诶风向
回复

使用道具 举报

Afuge 发表于 2015-7-17 14:18:21
回复

使用道具 举报

white_block 发表于 2015-7-30 09:30:02
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条