about云2015年每周经典回顾汇【第二篇】

上一篇：about云每周经典回顾汇总

2015年about云12月第04周经典帖子总结

Spark 源码和应用开发环境的构建
http://www.aboutyun.com/thread-16697-1-1.html
1、如何在Eclipse下设置Spark开发调试环境？
2、如何在IntelliJ下设置Spark开发调试环境？

推荐系统，第 1 部分: 方法和算法简介
http://www.aboutyun.com/thread-16745-1-1.html
1.推荐系统的常用算法有什么？
2.协作过滤使用的相似性和区别是什么？
3.推荐系统面临哪些挑战？

程序员面试技巧总结
http://www.aboutyun.com/thread-16738-1-1.html

Ambari——大数据平台的搭建利器
http://www.aboutyun.com/thread-16729-1-1.html

1.Ambari是什么？

2.Ambari怎么安装？

一个架构师谈什么是架构以及怎么成为一个架构师
http://www.aboutyun.com/thread-16710-1-1.html
1.架构的定义是什么？
2.什么是架构之美？
3.架构师都要会做什么？

Apache Spark 1.6预览版：更简便的搜索及诸多新特性
http://www.aboutyun.com/thread-16677-1-1.html

资源：
大数据和小米金融
http://www.aboutyun.com/thread-16718-1-1.html

谁说菜鸟不会数据分析基础篇
http://www.aboutyun.com/thread-16713-1-1.html

BDTC2015-宜信大数据-项亮-大数据在风险管理中的应用
http://www.aboutyun.com/thread-16734-1-1.html

基于R语言的跨平台大数据机器学习不数据分析系统
http://www.aboutyun.com/thread-16733-1-1.html

BDTC2015-阿里巴巴-鄢志杰（智捷）-Deep Learning助力客服小二：数据技术及机器学...
http://www.aboutyun.com/thread-16704-1-1.html

Spark streaming 的监控和优化
http://www.aboutyun.com/thread-16683-1-1.html

BDTC2015-Pivotal-姚延栋-开源大数据引擎：Greenplum 数据库架构分析
http://www.aboutyun.com/thread-16682-1-1.html

2015年about云12月第03周经典帖子总结

李彦宏：简单重复的脑力劳动将被人工智能取代
http://www.aboutyun.com/thread-16636-1-1.html

Spark Streaming 源码解析：实现思路与模块概述
http://www.aboutyun.com/thread-16582-1-1.html
1.基于 Spark 做 Spark Streaming 的思路是什么？
2.Spark Streaming 的整体模块划分是什么样子？
3.官方文档是如何描述的？

Neutron系列 : Neutron 是如何向 Nova 虚机分配固定IP地址的(10)
http://www.aboutyun.com/thread-16627-1-1.html

1.怎么去理解Linux network namespace ？

2.怎么去区分netfilter/iptables 基本概念？

大数据计算平台Spark内核全面解读(转载)
http://www.aboutyun.com/thread-16644-1-1.html

1.Spark内核有什么特性？

2.什么叫做RDD？
3.DAG和Stage任务如何生成？

【BDTC 2015】推荐系统分论坛：百度、FreeWheel、新浪微博、京东和猎聘推荐系统架...
http://www.aboutyun.com/thread-16618-1-1.html

1.关于BML百度大规模机器学习云平台的实践？

2.什么是基于大数据的新兴视频广告测量？

3.大数据驱动下的微博社会化推荐？

Deep Learning（深度学习）系列：（一）概述及背景--简介说明
http://www.aboutyun.com/thread-16597-1-1.html
1、什么是机器学习？
2、机器学习如何出现的？

Deep Learning（深度学习）系列：（二）概述及背景--特征
http://www.aboutyun.com/thread-16598-1-1.html
1、什么是机器学习特征？
2、结构性特征如何表示？

Cloudera Flume认证实例
http://www.aboutyun.com/thread-16581-1-1.html
1.Flume认证实例如何设置？
2.如何测试认证正确？

分布式一致性算法——paxos
http://www.aboutyun.com/thread-16575-1-1.html

1.什么是paxos算法？

2.paxos解决了什么问题？

大龄程序员的未来在何方
http://www.aboutyun.com/thread-16617-1-1.html

探索Spark源码---Driver程序如何与Spark集群建立联系？
http://www.aboutyun.com/thread-16608-1-1.html

资源：
短码之美：编程达人的心得技法【扫描版】
http://www.aboutyun.com/thread-16572-1-1.html

程序员的思维修炼（中文版书籍）
http://www.aboutyun.com/thread-16571-1-1.html

linux内核网络栈&linux牛人学习方法
http://www.aboutyun.com/thread-16577-1-1.html

疯狂的程序员
http://www.aboutyun.com/thread-16647-1-1.html

程序员自我修养
http://www.aboutyun.com/thread-16634-1-1.html

卓有成效的程序员（中文版）
http://www.aboutyun.com/thread-16633-1-1.html

透过数据看电子商务的市场前景原版
http://www.aboutyun.com/thread-16622-1-1.html

维度建模指南by_Z.RaiNy
http://www.aboutyun.com/thread-16621-1-1.html

数据分析工具
http://www.aboutyun.com/thread-16606-1-1.html

网络存储导论1.0【书籍】
http://www.aboutyun.com/thread-16590-1-1.html

[虚拟专网.技术与解决方案].Ruixi.Yuan.袁睿翕.W.Timothy.Strayer.扫描版
http://www.aboutyun.com/thread-16589-1-1.html

问答：

hive插入数据报错
http://www.aboutyun.com/thread-16604-1-1.html

使用hive distinct或group by 去重复，遇到奇怪问题
http://www.aboutyun.com/thread-16599-1-1.html

2015年about云12月第02周经典帖子总结

Spark机器学习入门实例——大数据集(30+g)二分类
http://www.aboutyun.com/thread-16489-1-1.html
1.输入数据与预期结构是什么？
2.如何进行二进制和多标签分类？
3.独立模式下如何运行和设置Apache Spark？
4.如何导入库？
5.如何准备练习和测试数据集？
6.如何准备训练模型？
7.如何准备测试模型？

hadoop代理用户 -超级用户代理其它用户
http://www.aboutyun.com/thread-16507-1-1.html
1.你认为什么情况下使用代理用户？
2.代理用户与普通用户的区别是什么？
3.如何配置超级用户代理其它用户？

SparkSQL结合SparkStreaming，通过SQL实现实时计算数据统计
http://www.aboutyun.com/thread-16529-1-1.html
1.本文的场景是什么？
2.SparkSQL结合SparkStreaming，通过SQL实现实时计算数据统计需要做哪些准备？
3.SparkSQL结合SparkStreaming，通过SQL实现实时计算数据统计如何通过代码实现？

寻路算法：A*算法介绍
http://www.aboutyun.com/thread-16542-1-1.html
1.什么是Dijkstra算法？
2.A*算法是目前最流行的寻路算法，为什么？
3.如何描述A*算法？

从MongoDB导入数据到HDFS
http://www.aboutyun.com/thread-16508-1-1.html
1.从MongoDB导入数据到HDFS需要做哪些准备？
2.如何实现从MongoDB导入数据到HDFS？
3.从MongoDB导入数据到HDFS的原理是什么？

架构师必看京东咚咚架构演进
http://www.aboutyun.com/thread-16487-1-1.html
1.京东咚咚是如何诞生的？
2.京东咚咚是如何成长的？
3.京东咚咚是如何爆发的？
4.京东咚咚是如何涅槃的？

程序员学习能力提升三要素
http://www.aboutyun.com/thread-16468-1-1.html

1.怎样才能善于读书？

2.如何高效学习？

3.怎么才能有好的心态？

35岁程序员的独家面试经历
http://www.aboutyun.com/thread-16541-1-1.html

程序员如何更快的适应新工作
http://www.aboutyun.com/thread-16513-1-1.html

周鸿祎谈程序员对程序员的认识及建议
http://www.aboutyun.com/thread-16475-1-1.html

资源：
memcached全面剖析
http://www.aboutyun.com/thread-16527-1-1.html

成为技术领导者
http://www.aboutyun.com/thread-16555-1-1.html

分布式数据库系统及其应用
http://www.aboutyun.com/thread-16554-1-1.html

Hortonworks 数据平台官方文档
http://www.aboutyun.com/thread-16543-1-1.html

点击流数据仓库
http://www.aboutyun.com/thread-16526-1-1.html

云计算及大数据处理通用产品平台介绍(CBI)
http://www.aboutyun.com/thread-16509-1-1.html

Linux内核Buddy算法的实现解析资料分享
http://www.aboutyun.com/thread-16497-1-1.html

key-value数据库
http://www.aboutyun.com/thread-16496-1-1.html

oozie使用手册
http://www.aboutyun.com/thread-16495-1-1.html

云计算自动化虚拟化【英文版书籍about云提供】
http://www.aboutyun.com/thread-16478-1-1.html

云应用架构【英文版书籍】
http://www.aboutyun.com/thread-16477-1-1.html

问答：

内存有限的情况下 Spark 如何处理 T 级别的数据？
http://www.aboutyun.com/thread-16528-1-1.html

sparksql 可以修改map数吗
http://www.aboutyun.com/thread-16517-1-1.html

探索Spark源码---DAG图
http://www.aboutyun.com/thread-16498-1-1.html

sparkstreaming结果怎么和传入的数据关联上？
http://www.aboutyun.com/thread-16488-1-1.html

探索Spark源码----RDD模型
http://www.aboutyun.com/thread-16483-1-1.html

2015年about云12月第01周经典帖子总结

程序员30过后
http://www.aboutyun.com/thread-16431-1-1.html

SparkSQL入门
http://www.aboutyun.com/thread-16386-1-1.html

使用Spark MLlib给豆瓣用户推荐电影
http://www.aboutyun.com/thread-16430-1-1.html

1.常用的推荐算法有哪些？

2.推荐系统是什么样的流程？

3.从这个推荐系统我们能学到什么？

算法与算法工程师，技术与技术人员
http://www.aboutyun.com/thread-16450-1-1.html

1.算法与算法工程师有什么区别？

2.技术与技术人员有什么区别？

3.如何清晰的对自己在工作中进行定位？

如何将 MapReduce 转化为 Spark
http://www.aboutyun.com/thread-16414-1-1.html
1.为什么说Spark 是对 MapReduce 模型的一种扩展？
2.mapreduce存在哪些缺陷？
3.如何实现 MapReduce 转化为 Spark？

spark streaming源码分析: DStream相关API
http://www.aboutyun.com/thread-16394-1-1.html
1、如何进行Input DStream创建的操作？
2、如何进行DStream操作？
3、如何进行K/V类型RDD转换操作？

如何在职场中实现“跨越式”成长
http://www.aboutyun.com/thread-16393-1-1.html

编程的智慧
http://www.aboutyun.com/thread-16384-1-1.html

科技大亨面试时都爱问什么样的面试问题？
http://www.aboutyun.com/thread-16382-1-1.html

资源：
NoSQL精粹_中文完整版【书籍】
http://www.aboutyun.com/thread-16387-1-1.html

数据分析与R语言视频教程+课件
http://www.aboutyun.com/thread-16360-1-1.html

网络爬虫-抓包分析
http://www.aboutyun.com/thread-16456-1-1.html

网络爬虫综述
http://www.aboutyun.com/thread-16455-1-1.html

奉上最近收藏的英文原版书
http://www.aboutyun.com/thread-16440-1-1.html

R语言教程
http://www.aboutyun.com/thread-16437-1-1.html

spark源码走读之DAGSchedule
http://www.aboutyun.com/thread-16418-1-1.html

大数据时代
http://www.aboutyun.com/thread-16398-1-1.html

数据挖掘：概念与技术（韩家炜）
http://www.aboutyun.com/thread-16397-1-1.html

Jedis开发手册
http://www.aboutyun.com/thread-16391-1-1.html

Spark-Architecture
http://www.aboutyun.com/thread-16388-1-1.html

R语言与统计分析
http://www.aboutyun.com/thread-16362-1-1.html

2015年about云11月第05周经典帖子总结
听阿里技术大神讲解今年双11背后的关键技术
http://www.aboutyun.com/thread-16163-1-1.html
1.今年双11背后都采用了哪些关键技术？
2.OceanBase数据库的使用情况如何？
3.OceanBase到底是什么？
4.两地三中心对于阿里来讲有什么问题？
5.阿里决定开始做异地多活的主要目标是什么？
6.异地多活最大的挑战是什么？
7.异地多活最大的好处是什么？

漫谈程序员系列：一张图道尽程序员的出路
http://www.aboutyun.com/thread-16229-1-1.html

1.程序员的路在何方？

2.程序员是怎么进入三界？

3.程序员是怎么跳出三界？

培训机构毕业的程序员被歧视的背后逻辑
http://www.aboutyun.com/thread-16175-1-1.html
1.教育和培训，你真的知道吗？
2.程序员需要的能力是？
3.认清自己才是开始？

一个Hadoop老兵的自白
http://www.aboutyun.com/thread-16333-1-1.html

使用 Spring、Elasticsearch 及 Logstash 构建企业级数据搜索和分析平台
http://www.aboutyun.com/thread-16177-1-1.html

1.什么是Elasticsearch？

2.Elasticsearch的基本用法是？

3.该应用场景是什么？

Apache Ignite 新一代数据库缓存系统
http://www.aboutyun.com/thread-16158-1-1.html
1.Apache Ignite允许什么数据存储在内存中？
2.Apache Ignite如何实现自动化持久数据？
3.Ignite是否支持任何底层存储平台？

Lucene 入门详解
http://www.aboutyun.com/thread-16145-1-1.html
1.如何创建索引流程？
2.索引的核心类是什么？
3.如何创建搜索流程？
4.搜索的核心类是什么？

推荐系统基础知识储备
http://www.aboutyun.com/thread-16142-1-1.html
1.推荐算法模型可分为哪几类？
2.什么是基于内容的推荐？
3.计算物品距离的几种方法？
4.计算相似度量的几种方法？
5.什么是基于协同过滤的推荐？
6.基于模型推荐有哪几种？

问答：

百度云盘涉及的技术是什么呢？
http://www.aboutyun.com/thread-16132-1-1.html

资源：
about云-Apache_Hadoop高级篇：hadoop的兼容性说明【最新版】
http://www.aboutyun.com/thread-16196-1-1.html

spark高级分析【英文版about云提供】
http://www.aboutyun.com/thread-16197-1-1.html

大数据之：大话数据结构
http://www.aboutyun.com/thread-16330-1-1.html

数据挖掘书籍——概念、模型、方法和算法
http://www.aboutyun.com/thread-16343-1-1.html

数据挖掘技术及应用
http://www.aboutyun.com/thread-16344-1-1.html

spark内幕【英文版about 云提供80页】
http://www.aboutyun.com/thread-16259-1-1.html

RHadoop项目总结
http://www.aboutyun.com/thread-16166-1-1.html

RDD介绍：内存集群计算中的抽象【英文版about云提供】
http://www.aboutyun.com/thread-16165-1-1.html

OpenStack实战指南全本电子书
http://www.aboutyun.com/thread-16161-1-1.html

MapReduce 集群上简化数据处理
http://www.aboutyun.com/thread-16147-1-1.html

用Scala和Clojure函数编程模式
http://www.aboutyun.com/thread-16146-1-1.html

2015年about云11月第04周经典帖子总结

Apache Hadoop高级篇：hadoop的兼容性说明-相关hadoop项目版本之间的关系等【上】
http://www.aboutyun.com/thread-16013-1-1.html
1.根据下文hadoop2.1.1客户端与hadoop2.4.0集群是否可以通信？
2.hadoop2.4.0客户端与hadoop2.3.0集群【服务器】是否可以通信？
3.升级后集群，hdfs,mapreduce，yarn程序是否需要修改？
4.hadoop单独组建是否可以升级？
5.hadoop主版本升级后，如flume是否受影响？

爬虫入门讲解：基础理论篇
http://www.aboutyun.com/thread-16044-1-1.html
1.我们使用爬虫的目的是什么？
2.我们所需要的内容从何而来？
3.请求是如何绕过限制？
4.如何发送正确的数据？
5.如何模拟请求？
6.常见的限制方式有哪些？
7.哪些路径可以获取到数据源？

看大数据和机器学习如何助力公司腾飞
http://www.aboutyun.com/thread-16089-1-1.html

1.企业怎么提高工作效率?

2.企业怎么智能化的生产?

3.大数据和机器学习如何助力公司腾飞?

Redis系统入门【上】
http://www.aboutyun.com/thread-16069-1-1.html
1.Redis是什么？
2.Redis数据结构是什么？
3.Redis的集合？

态度以及业余付出决定程序生涯
http://www.aboutyun.com/thread-16067-1-1.html
1.关于程序员的生活应该怎样？
2.关于态度是如何的?
3.关于付出是如何的？

最全面的程序员招聘建议
http://www.aboutyun.com/thread-16043-1-1.html
1.简历是是数字化的还需传统的？
2.自我评估哪些方面？
3.我们应该立志成为一个全栈的开发人员呢，还是成为某一门编程语言的专家？
4.我们应该关注哪些经验教训？
5.程序员面试有哪些要点？

如何做用户行为路径分析
http://www.aboutyun.com/thread-16025-1-1.html
1.路径分析业务应用在哪些场景？
2.如何获取路径分析数据？
3. 漏斗模型与路径分析有什么关系？
4.路径分析有哪些方法？

Hadoop之NameNode+ResourceManager高可用原理分析
http://www.aboutyun.com/thread-16024-1-1.html
1.NameNode-HA工作
2.Zookeeper可以干的事
3.新集群配置高可用后，如何使用？

Hadoop加速器GridGain
http://www.aboutyun.com/thread-16012-1-1.html

1.怎样配置Hadoop集群？

2.怎样配置GridGain加速器？

3.怎样利用MapReduce统计单词数？

Redis持久化
http://www.aboutyun.com/thread-16011-1-1.html

1.redis支持哪几种持久化方式？

2.如果应用要求不能丢失任何修改的话，应该采用哪种持久化方式？

3.什么是redis的虚拟内存？

资源：
细细品味架构_第4期（微博在大规模、高负载系统问题排查方法）
http://www.aboutyun.com/thread-16033-1-1.html

Google 三大论文【中文版】
http://www.aboutyun.com/thread-16108-1-1.html

Scala并行编程学习【英文版about云】
http://www.aboutyun.com/thread-16107-1-1.html

基于统计的自然语言处理的数学基础
http://www.aboutyun.com/thread-16097-1-1.html

韩卿：Apache Kylin－Hadoop上的大规模联机分析平台
http://www.aboutyun.com/thread-16096-1-1.html

JVM源码分析之javaagent原理完全解读
http://www.aboutyun.com/thread-16079-1-1.html

云平台上的NoSQL集群的自动化扩展-董伟
http://www.aboutyun.com/thread-16078-1-1.html

聚类分析
http://www.aboutyun.com/thread-16056-1-1.html

细细品味架构_第5期（解析Docker在芒果TV的实践之路）
http://www.aboutyun.com/thread-16055-1-1.html

统计建模与R软件代码及答案：代码
http://www.aboutyun.com/thread-16015-1-1.html

统计建模与R软件代码及答案：书籍
http://www.aboutyun.com/thread-16014-1-1.html

2015年about云11月第03周经典帖子总结

[干货]如何构建用户画像
http://www.aboutyun.com/thread-15967-1-1.html

1.什么是用户自画像？

2.如何构建用户自画像？

3.为什么需要用户自画像？

Spark分区器HashPartitioner和RangePartitioner代码详解
http://www.aboutyun.com/thread-15976-1-1.html

1.HashPartitioner分区怎么用源码解析?

2.RangePartitioner分区怎么用源码解析?

3.定位分区ID怎么用源码解析?

开源爬虫框架各有什么优缺点？
http://www.aboutyun.com/thread-15968-1-1.html
1.爬虫如何使用分布式？
2.JAVA的单机爬虫的功能？
3.非JAVA单机爬虫怎么样？

Redis 横向扩展案例
http://www.aboutyun.com/thread-15950-1-1.html
1. 为什么使用Redis？
2.单点 Redis 实例崩溃的原因是什么？
3.如何解决崩溃现象？
4.如何解决数据倾斜的问题？
5.Twemproxy 工作原理是什么？

机器学习入门指南
http://www.aboutyun.com/thread-15948-1-1.html
1.何为机器学习？
2.有哪些机器学习算法？
3.怎样深入学习机器学习

数据挖掘从业人员工作分析/相关岗位/职业薪酬等详细介绍
http://www.aboutyun.com/thread-15933-1-1.html
1.数据挖掘就业的途径有哪几种？
2.需要掌握哪些技能？
3.数据挖掘人员需具哪些基本条件，才可以完成数据挖掘项目中的相关任务？
4.数据挖掘有那几个岗位？

hadoop入门手册5：Hadoop【2.7.1】初级入门之命令：文件系统shell2
http://www.aboutyun.com/thread-15924-1-1.html
1.改变hdfs文件的权限，需要修改哪个配置文件？
2.获取一个文件的或则目录的权限，哪个命令可以实现？
3.哪个命令可以实现设置访问控制列表（ACL）的文件和目录？

Spring Cloud Data Flow:来自被重构的SpringXD
http://www.aboutyun.com/thread-15922-1-1.html

1.Spring XD与Spring Cloud Data Flow有何不同？

2.使用隔离的微服务应用架构应该使用何种加载器？

3.怎样用Spring Cloud Data Flow将应用部分串到一起？

资源：
Hadoop应用浅析
http://www.aboutyun.com/thread-15940-1-1.html

高效程序员的45个习惯：敏捷开发修炼之道【189页】
http://www.aboutyun.com/thread-16008-1-1.html

about云hadoop手册【最新版本】
http://www.aboutyun.com/thread-15995-1-1.html

鸟哥的Linux私房菜基础学习篇第三版
http://www.aboutyun.com/thread-15983-1-1.html

python程序员指南
http://www.aboutyun.com/thread-15982-1-1.html

python程序员指南
http://www.aboutyun.com/thread-15982-1-1.html

冯兴东：R语言和其他计算机语言的混合编程
http://www.aboutyun.com/thread-15971-1-1.html

陈逸波：基于RHadoop的关联规则挖掘
http://www.aboutyun.com/thread-15970-1-1.html

淘宝数据应用开发平台iData
http://www.aboutyun.com/thread-15939-1-1.html

淘宝数据服务平台：架构与实践泽远
http://www.aboutyun.com/thread-15926-1-1.html

淘宝分布式数据处理实践
http://www.aboutyun.com/thread-15925-1-1.html

2015年about云11月第02周经典帖子总结

大规模主题模型：对Spark LDA算法的改进
http://www.aboutyun.com/thread-15859-1-1.html
1.本文如何用450万条维基百科词条的文档集训练一个话题模型？
2.在线变分预测是一种什么技术？
3.对Spark LDA算法的改进有哪些？

大数据之有指导数据挖掘方法模型
http://www.aboutyun.com/thread-15887-1-1.html

1.定义模型的结构和目标？

2.增加响应建模？

3.考虑模型的稳定性？

4.通过预测模型、剖析模型来讨论模型的稳定性？

你应该知道的机器学习方法
http://www.aboutyun.com/thread-15875-1-1.html
1.你正在解决的问题类型是什么？
2.识别机器学习类别的方法？
3.如何选择适合你风险承受能力的技术？

这8种武器点亮程序员的个人品牌
http://www.aboutyun.com/thread-15850-1-1.html
1.什么是程序员的个人品牌？
2.程序员该如何经营个人品牌？
3.程序员的个人品牌亮点在哪里？

问答：

flume日志收集效率问题
http://www.aboutyun.com/thread-15878-1-1.html

资源：
about云文档大数据云技术实战文档汇总
http://www.aboutyun.com/thread-15869-1-1.html

制作openstack image
http://www.aboutyun.com/thread-15845-1-1.html
Hadoop集群监控与Hive高可用-向磊
http://www.aboutyun.com/thread-15881-1-1.html

45分钟搞定R语言之数据库交互及统计绘图
http://www.aboutyun.com/thread-15880-1-1.html

Hadoop与数据分析
http://www.aboutyun.com/thread-15891-1-1.html

海量日志分析系统实践,新浪DBA
http://www.aboutyun.com/thread-15918-1-1.html

暴风数据平台简介-赵修湘
http://www.aboutyun.com/thread-15904-1-1.html

hive学习笔记阿里巴巴
http://www.aboutyun.com/thread-15903-1-1.html

自动安装kilo版本openstack开发环境
http://www.aboutyun.com/thread-15892-1-1.html

分享几本Hadoop的书籍
http://www.aboutyun.com/thread-15889-1-1.html

深度学习自然语言处理及相关应用
http://www.aboutyun.com/thread-15857-1-1.html

关于机器学习应用数学的几点说明【英文版about云提供】
http://www.aboutyun.com/thread-15856-1-1.html

2015年about云11月第01周经典帖子总结

大数据工程师需要了解哪些基础知识？
http://www.aboutyun.com/thread-15765-1-1.html
1.大数据工程师需要做什么？
2.需要具备怎么样的能力？
3.以后的发展怎么样？

程序员跳槽的最佳时机选择
http://www.aboutyun.com/thread-15754-1-1.html

什么是用户画像？金融行业大数据用户画像实践
http://www.aboutyun.com/thread-15745-1-1.html
1.用户画像的目的是什么？
2.使用用户画像的原因是什么？
3.用户画像工作坚持什么原则？
4.用户画像的方法划分为哪几个纬度？
5.金融企业如何使用用户画像的？
6.移动大数据有哪些商业价值？

如何成为强大的程序员？
http://www.aboutyun.com/thread-15792-1-1.html

1.哪十种程序员无法意识到自己的潜力？

2.我们程序员怎么去改变呢？

3.天才程序员离我们还多远？

Kafka 设计与原理详解
http://www.aboutyun.com/thread-15812-1-1.html
1.kafka可以用来做什么?
2.kafka的重要设计思想是什么？
3.kafka的核心组件和特性是什么？
4.kafka集群部署怎么部署？

成为专业程序员的 6 个技巧
http://www.aboutyun.com/thread-15809-1-1.html
1.如何成为专业的程序员？
2.成为专业的程序员需要掌握哪些工具？

程序员技术晋升非正式攻略
http://www.aboutyun.com/thread-15780-1-1.html
1.晋升的申请材料怎么写？
2. 晋升有什么好处？
3. 技术晋升中技术能力与非技术业务能力的比重？

程序员如何从“职业倦怠”中恢复过来
http://www.aboutyun.com/thread-15760-1-1.html
1.如何克服可怕的“职业倦怠”?
2.丰盛的早餐有哪些好处？
3.吃零食好不好？
4.水重要吗？
5.要不要加班？

Hadoop【2.7.1】初级入门之命令指南
http://www.aboutyun.com/thread-15746-1-1.html
1.hadoop daemonlog管理员命令的作用是什么？
2.hadoop如何运行一个类，如何运行一个jar包？
3.hadoop archive的作用是什么？

58同城沈剑：好的架构不止要有好的设计，更需要不停地衍变
http://www.aboutyun.com/thread-15733-1-1.html

1.从小流量、中等规模流量、大流量，到更大的流量过程中，架构是如何演进的？

2.创业初期怎样选择一个合适架构的？

3.面对更大的流量时，怎样不断提升高可用？

海量可视化日志分析平台之ELK搭建
http://www.aboutyun.com/thread-15731-1-1.html
1.ELK是什么？
2.为什么要用ELK?
3.ELK的安装？

资源：

kafka-0.8.1.1入门系统总结
http://www.aboutyun.com/thread-15796-1-1.html

金融计算与建模：理论、算法与SAS程序
http://www.aboutyun.com/thread-15795-1-1.html

Python 定向爬虫入门1:基本的正则表达式
http://www.aboutyun.com/thread-15783-1-1.html

Python 定向爬虫入门2:Python 单线程爬虫
http://www.aboutyun.com/thread-15784-1-1.html

Python 定向爬虫入门3:XPath 与多线程爬虫
http://www.aboutyun.com/thread-15785-1-1.html

图像工程(第二版1078页)【推荐】
http://www.aboutyun.com/thread-15768-1-1.html

hadoop2.6 hbase0.99.2伪分布式环境搭建
http://www.aboutyun.com/thread-15767-1-1.html

HadoopArchives详解
http://www.aboutyun.com/thread-15751-1-1.html

企业云化的痛点与实践_汤人杰_行至水穷处、云起浙里时--浙江移动云计算和大数据实践
http://www.aboutyun.com/thread-15739-1-1.html

企业云化的痛点与实践_兰杰_高德亿级用户系统云化实战V1.3
http://www.aboutyun.com/thread-15738-1-1.html

2015年about云10月第04周经典帖子总结

高薪程序员都避开了哪些坑
http://www.aboutyun.com/thread-15667-1-1.html

【写给新人】做开发几年的个人经历
http://www.aboutyun.com/thread-15674-1-1.html

编程思想之消息机制
http://www.aboutyun.com/thread-15685-1-1.html
1.什么是消息？
2.本文通过什么例子来诠释消息？
3.如何通过程序模拟消息？

“今日头条”怎么计算：“网络爬虫+相似矩阵”技术运作流程
http://www.aboutyun.com/thread-15711-1-1.html
1.分析“今日头条”的传播机制与相关原理。
2.网络爬虫是什么？
3.“今日头条”的个性推荐系统是怎么设计的？
4.什么叫做聚合媒体?

如何才能成为一个好的技术领导者？
http://www.aboutyun.com/thread-15690-1-1.html

1.怎么将自己视为其他开发人员的导师？

2.怎么准备好回答团队成员的问题？

3.做到这些你就可以成为一个好的技术领导者？

数据可视化方法、工具、核心理念
http://www.aboutyun.com/thread-15652-1-1.html
1、数据可视化是什么？
2、数据可视化为什么重要？
3、存在哪些数据可视化方法？
4、赢得数据可视化背后的关键理念？
5、完成数据可视化时需要避免的深坑？

hadoop【2.7.1】【多节点】集群配置【必知配置知识2】
http://www.aboutyun.com/thread-15650-1-1.html
1.如何实现检测NodeManagers健康？
2.配置ssh互信的作用是什么？
3.启动、停止hdfs有哪些方式？

资源：

洪健飞：啤酒与尿布的当代版——商品分析在电子商务中的应用
http://www.aboutyun.com/thread-15642-1-1.html

开源分布式文件系统
http://www.aboutyun.com/thread-15694-1-1.html

云计算深刻改变未来
http://www.aboutyun.com/thread-15693-1-1.html

spark 中文编程资料分享
http://www.aboutyun.com/thread-15691-1-1.html

机器学习Scala Packt出版社（2014about云提供英文版555页）
http://www.aboutyun.com/thread-15684-1-1.html

scala_cookbook【英文版about云提供722页】
http://www.aboutyun.com/thread-15683-1-1.html

评估面向大数据 ETL的Apache Hadoop 软件
http://www.aboutyun.com/thread-15655-1-1.html

袁晓如：大数据时代可视化分析的机遇与挑战
http://www.aboutyun.com/thread-15654-1-1.html

问答：
openstack无法进入horizon登陆界面？
http://www.aboutyun.com/thread-15661-1-1.html

2015年about云10月第03周经典帖子总结

不想当一辈子码农，这有份IT民工进阶手册
http://www.aboutyun.com/thread-15562-1-1.html
1.程序员如何在职场中闯关进阶？
2.有多少道关要闯？
3.该怎样走出瓶颈？
4.程序员应该如何不留遗憾地度过这一生？

我们从这里开始，走过荆棘，迈向前方——微博推荐架构的演进
http://www.aboutyun.com/thread-15586-1-1.html
1.微博推荐在流程上的构成是什么？
2.微博推荐各版本的特点？
3.微博推荐架构是如何演进的？

Hadoop（17）MapReduce 文件处理：小文件
http://www.aboutyun.com/thread-15592-1-1.html

1.MapReduce是怎样处理小文件的？

2.使用Avro存储多个小文件？

3.怎么读取多个小文件并在HDFS中生成一个单一的Avro文件？

Hadoop(大数据)面试题 --找共同朋友
http://www.aboutyun.com/thread-15606-1-1.html

如何通过官网查找hadoop、hbase、hive版本兼容信息
http://www.aboutyun.com/thread-15568-1-1.html
1.如何查看hbase与hadoop的兼容？
2.hive是否与所有hadoop兼容？
3.hadoop2.7.1 hbase1.2.x hive1.2.0是否兼容？

小团队机器学习实践
http://www.aboutyun.com/thread-15614-1-1.html
1.小团队和大团队有什么区别？
2.小团队的优势有哪些？
3.有哪些误区应该躲避？

hadoop(大数据)统计相同手机号的总数
http://www.aboutyun.com/thread-15605-1-1.html

电商数据分析基础指标体系
http://www.aboutyun.com/thread-15577-1-1.html
1、电商数据分析指标体系分为哪几类？
2、电商总体运营指标包括哪几个方面？
3、网站流量指标包括哪几个方面？
4、网站销售（转化率）类指标包括哪几个方面？

Hadoop（14）MapReduce 性能调优：减小数据倾斜的性能损失
http://www.aboutyun.com/thread-15544-1-1.html
1.如何确定倾斜的数据，如何缓解它们的影响
2.常见的数据倾斜有哪几类？
3.诊断map输出中哪些键存在数据倾斜？
4.如何减小Reduce数据倾斜的性能损失？

资源：
Lucene+nutch搜索引擎开发【推荐】
http://www.aboutyun.com/thread-15582-1-1.html

Spark.Cookbook【about云提供】
http://www.aboutyun.com/thread-15550-1-1.html

R与十大算法
http://www.aboutyun.com/thread-15549-1-1.html

大数据资料demo版
http://www.aboutyun.com/thread-15603-1-1.html

刘思喆：R语言环境下的文本挖掘
http://www.aboutyun.com/thread-15602-1-1.html

教你通过官网查找hadoop、hbase、hive版本兼容信息
http://www.aboutyun.com/thread-15588-1-1.html

storm自学笔记
http://www.aboutyun.com/thread-15571-1-1.html

2015年about云10月第01，02

如何编写一个分布式数据库
http://www.aboutyun.com/thread-15388-1-1.html

1.如何写一个分布式数据库?
2.数据库系统架构如何分层?
3.SQL层如何映射到KV层?

量化派基于Hadoop、Spark、Storm的大数据风控架构
http://www.aboutyun.com/thread-15474-1-1.html
1、机器学习在如何在量化派中应用？
2、量化派的大数据平台架构包含哪些内容？
3、不同场景的机器学习有哪些方法？

我在雅虎获得的 8 个最好的职业建议【推荐】
http://www.aboutyun.com/thread-15491-1-1.html
1.本文认为怎么样才能得到提拔？
2.如果你做领导，你会选择什么风格？
3.与人争论输赢各有什么好处和坏处？

技术到管理的蜕变
http://www.aboutyun.com/thread-15492-1-1.html

Spark 1.5版本说明
http://www.aboutyun.com/thread-15475-1-1.html
1、Spark 1.5与Spark 1.4相比有哪些改进？
2、backpressure机制是什么？为什么Spark 1.5中添加该功能？
3、2015年，Spark主要致力研究什么？
4.Spark 1.5还侧重于实用性方面有哪些体现？

互联网和金融在数据挖掘上究竟存在什么区别？
http://www.aboutyun.com/thread-15469-1-1.html

1.本文是如何划分数据挖掘层次的？

2.传统数据模型有哪些？

3.本文认为互联网和金融数据挖掘的差异在什么地方？

人工智能 11 种错误认识
http://www.aboutyun.com/thread-15468-1-1.html

微店的大数据平台建设实践与探讨
http://www.aboutyun.com/thread-15448-1-1.html

1.什么是数据集？

2.大数据平台建设一般由哪几层组成？

3.平台中各个层次的主要功能、组建有哪些？

HTTP已过时，未来属于分布式永久有效的Web
http://www.aboutyun.com/thread-15438-1-1.html

1.HTTP的缺陷有哪些？

2.IPFS如何解决HTTP的缺陷？

资源：
腾讯游戏的Docker实践
http://www.aboutyun.com/thread-15459-1-1.html

Shell脚本学习指南中文PDF版
http://www.aboutyun.com/thread-15528-1-1.html

金融行业私有云思考与实践-V4
http://www.aboutyun.com/thread-15509-1-1.html

细细品味架构_第2期（基于Xapian的垂直搜索引擎的构建分析）
http://www.aboutyun.com/thread-15490-1-1.html

细细品味Kafka_Kafka简介及安装_V1.3
http://www.aboutyun.com/thread-15489-1-1.html

面向开发者的云原生应用技术
http://www.aboutyun.com/thread-15480-1-1.html

RAID技术及应用
http://www.aboutyun.com/thread-15479-1-1.html

容器存储趋势的发展
http://www.aboutyun.com/thread-15470-1-1.html

深入Docker的资源管理
http://www.aboutyun.com/thread-15458-1-1.html

百度基础平台和开放云容器应用实践
http://www.aboutyun.com/thread-15452-1-1.html

分布式平台微服务架构演化实践
http://www.aboutyun.com/thread-15451-1-1.html

3小时-快速了解PostgreSQL
http://www.aboutyun.com/thread-15436-1-1.html

异地多活数据中心架构设计与实践
http://www.aboutyun.com/thread-15429-1-1.html

Zabbix使用手册
http://www.aboutyun.com/thread-15386-1-1.html

2015年about云09月第03周

为什么会有Map-reduce v2 (Yarn)
http://www.aboutyun.com/thread-15250-1-1.html
1.Map-reduce1，还可用吗?
2.Yarn的设计有哪些需求？
3.老的Map-reduce是如何设计的？
4.Map-reduce v2是如何设计的？
5.Map-reduce v2有哪些优点？

HBase、MongoDB、MySQL、Oracle、Redis--nosql数据库与关系数据库对比
http://www.aboutyun.com/thread-15275-1-1.html
1.三大nosql数据库与关系数据都是什么语言实现的？
2.本文5中数据库分别可以运行在哪些数据库？
3.5种数据中哪个不支持二级索引？

Lucene学习总结之一：全文检索的基本原理
http://www.aboutyun.com/thread-15263-1-1.html
1、什么叫做全文检索呢？
2、全文检索就存在三个重要问题是什么？
3、索引里面究竟需要存些什么呢？
4、如何创建索引？
5、如何判断搜索出的文档和查询语句的相关性呢？
6、如何对索引进行搜索？
7、如何判断文档之间的关系？
8、Lucene的检索过程是什么？

各种编程语言的深度学习库整理
http://www.aboutyun.com/thread-15262-1-1.html

Hadoop安全实践
http://www.aboutyun.com/thread-15248-1-1.html
1.hadoop集群安全问题包括哪些方面？
2.集群账号如何管理？
3.用户账号如何管理？
4.凭证过期采取什么样的处理策略？
5.没有对凭证做周期的更新，那怎么保证凭证不会过期呢?

从LinkedIn，Apache Kafka到Unix哲学
http://www.aboutyun.com/thread-15229-1-1.html

1.Unix系统里可组合性和拓展性是指什么？

2.Unix有哪些局限性？

3.Kafka解决了Unix 管道的哪些问题？

4.Kafka与Unix管道有哪些不同点？

寻路推荐理念篇
http://www.aboutyun.com/thread-15228-1-1.html
1.产品与算法的区别？
2.推荐算法的先决条件是什么？
3.人与算法的有哪些相互作用？

大数据发展的根基是什么？
http://www.aboutyun.com/thread-15222-1-1.html

openstack【Kilo】入门【keystone篇】八：创建租户, 用户, 和角色【centos】
http://www.aboutyun.com/thread-15216-1-1.html
1.如何创建管理员租户及相关用户、角色？
2.如何创建普通租户？

低效程序员的7个坏习惯
http://www.aboutyun.com/thread-15211-1-1.html

1.为什么程序员不喜欢测试代码？

2.为什么程序员喜欢说“不”？

3.为什么程序员不能和其他人友好相处？

openstack【Kilo】入门【准备篇】三：NTP安装【centos】
http://www.aboutyun.com/thread-15207-1-1.html
1.这里控制节点与其它节点之间的关系是什么？
2.如何让其它节点同步controller节点的时间？
3.如何验证ntp是否成功？有没有其它方法？

资源：
数据分析方法五种【535页】
http://www.aboutyun.com/thread-15253-1-1.html

数据之巅（完整版）
http://www.aboutyun.com/thread-15308-1-1.html

数据之美【书籍】
http://www.aboutyun.com/thread-15307-1-1.html

细细品味Hadoop_第16期_ZooKeeper简介及安装_V1.2
http://www.aboutyun.com/thread-15281-1-1.html

Hadoop高级编程——构建与实现大数据解决方案
http://www.aboutyun.com/thread-15280-1-1.html

在大数据上近似查询
http://www.aboutyun.com/thread-15265-1-1.html

阿里巴巴中文站架构设计实践(何崚)
http://www.aboutyun.com/thread-15264-1-1.html

机器学习实战中文文字版【296页】
http://www.aboutyun.com/thread-15252-1-1.html

面试中的44个关键问题
http://www.aboutyun.com/thread-15236-1-1.html

学习go语言
http://www.aboutyun.com/thread-15235-1-1.html

R语言数据操作
http://www.aboutyun.com/thread-15218-1-1.html

R语言初学者指南【199页】推荐
http://www.aboutyun.com/thread-15217-1-1.html

问答：

求助：nova-compute不能启动
http://www.aboutyun.com/thread-15225-1-1.html

Hive distinct 和join on查询语句如何优化
http://www.aboutyun.com/thread-15209-1-1.html

2015年about云09月第02周

大数据到底如何在企业中发挥价值
http://www.aboutyun.com/thread-15115-1-1.html

机器学习五种编程语言比较，Python最擅长
http://www.aboutyun.com/thread-15131-1-1.html
1.本文认为好的语言有什么规则？
2.MATLAB语言有什么特点？
3.R和Python之间有什么不同？

机器学习之集成学习基础入门
http://www.aboutyun.com/thread-15146-1-1.html
1.什么是集成学习？
2.常用的集成学习技术有哪些？
3.你认为什么是集成学习？

五个习惯保证高效的工作
http://www.aboutyun.com/thread-15164-1-1.html

hbase使用难题：如何实现有效地支持多条件查询
http://www.aboutyun.com/thread-15169-1-1.html

大数据架构师必读：常见的七种Hadoop和Spark项目案例
http://www.aboutyun.com/thread-15134-1-1.html

Apache Spark在大规模分布式自然语言处理的应用
http://www.aboutyun.com/thread-15109-1-1.html
1.Spark与Map/Reduce有哪些区别？
2.Spark处理数据的过程是怎样的？
3.Spark有哪些优势？

国家出台大数据纲要助力经济转型,大数据技术已经成为程序员必备技能
http://www.aboutyun.com/thread-15094-1-1.html

利用python yielding创建协程将异步编程同步化
http://www.aboutyun.com/thread-15092-1-1.html

资源：

Nutch入门
http://www.aboutyun.com/thread-15138-1-1.html

网络爬虫技术综述及nutch抓取策略研究
http://www.aboutyun.com/thread-15137-1-1.html

HBase源码分析【73页】
http://www.aboutyun.com/thread-15136-1-1.html

CEPH官方文档中译【332页】
http://www.aboutyun.com/thread-15135-1-1.html

CLEMENTINE数据挖掘方法及应用
http://www.aboutyun.com/thread-15117-1-1.html

统计学与R读书笔记
http://www.aboutyun.com/thread-15116-1-1.html

数据挖掘与R语言
http://www.aboutyun.com/thread-15101-1-1.html

R软件数据分析高级部分【案例分析】
http://www.aboutyun.com/thread-15100-1-1.html

问答：

求助 flume 日志堆积问题
http://www.aboutyun.com/thread-15153-1-1.html

如何辨别一个程序员的水平高低
http://www.aboutyun.com/thread-15150-1-1.html

2015年about云09月第01周

详细解释数据挖掘中的 10 大算法（上）
http://www.aboutyun.com/thread-15083-1-1.html

1.C4.5是做什么的？
2.什么是k 均值聚类算法？

3.支持向量机是做什么的？

4.什么是Apriori 关联算法是？

5.EM 算法是做什么的？

Spark通过Java Web提交任务
http://www.aboutyun.com/thread-15084-1-1.html
1.本文用到哪些软件？
2.本文的场景是有哪些？
3.Spark通过Java Web提交任务如何实现的？

视频监控“入云”11个理由
http://www.aboutyun.com/thread-15009-1-1.html
1.什么是VSaaS？
2.传统方式视频监控与云视频监控对比更有哪些吸引力？
3.视频监控“入云”的关键点是什么？

机器学习开发者的现代化路径：不需要从统计学微积分开始
http://www.aboutyun.com/thread-15007-1-1.html
1.机器学习的传统方法从表面上看起来，它是缜密的、系统的、听起来似乎是正确的观点，又怎么可能是错误的呢？
2.机器学习的传统方法如何杀死萌芽中的程序员？
3.一个更好机器学习的方法是什么？
4.开发者如何避免常见的错误？

深度学习应用案例参考：德国用深度学习算法让人工智能系统学习梵高画名画
http://www.aboutyun.com/thread-15069-1-1.html

递归神经网络的启示和神奇的效果
http://www.aboutyun.com/thread-15066-1-1.html

Redis GEO 特性简介
http://www.aboutyun.com/thread-15063-1-1.html
1、了解Redis GEO 特性。
2、Redis GEO 如何添加位置和获取位置？
3、Redis GEO 如何计算两位置之间的距离？
4、利用Redis GEO 特性去解决什么问题？

Kafka开发环境搭建及代码示例
http://www.aboutyun.com/thread-15059-1-1.html
1.如何通过maven添加jar包依赖？
2.配置文件作用的接口如何实现配置各种参数？

Hbase总结：Hbase中的Coprocessor
http://www.aboutyun.com/thread-15051-1-1.html
1、Hbase的缺点是什么？是如何解决这些缺点的？
2、什么是协处理器？分为哪2种类型？
3、了解RegionObserver工作原理。
4、了解终端的使用流程。
5、本文用例子说明了协处理器的高效性。
6、Coprocessor二级索引方案优劣性。

Redis整合Spring项目搭建实例指导
http://www.aboutyun.com/thread-15049-1-1.html
1.如何使用注解的方式,将Redis缓存整合到Spring项目？
2.如何用Redis来继承实现CacheService接口？

程序员思考：什么是真正的编程能力
http://www.aboutyun.com/thread-15035-1-1.html

工程師必备：自學的能力
http://www.aboutyun.com/thread-15034-1-1.html

资源：

R语言：数据分析与图形艺术
http://www.aboutyun.com/thread-15081-1-1.html

R语言_Learning_R学习R语言
http://www.aboutyun.com/thread-15080-1-1.html

机器学习概率论【英文1098页】
http://www.aboutyun.com/thread-15071-1-1.html

机器学习的基础【427页】
http://www.aboutyun.com/thread-15070-1-1.html

SPSS实用统计分析教程【403页】
http://www.aboutyun.com/thread-15062-1-1.html

SPSS统计分析从入门到精通【588页】
http://www.aboutyun.com/thread-15061-1-1.html

数据挖掘实践：机器学习和工具和技术【英文书籍】
http://www.aboutyun.com/thread-15056-1-1.html

Java 面试题及面试宝典
http://www.aboutyun.com/thread-15055-1-1.html

统计学-基本概念和方法
http://www.aboutyun.com/thread-15038-1-1.html

深入浅出统计学（美）道恩·格里菲思【744页】
http://www.aboutyun.com/thread-15037-1-1.html

R语言N种武器
http://www.aboutyun.com/thread-15017-1-1.html

问答：

[求助]hadoop ha 主备节点切换时实现邮件通知
http://www.aboutyun.com/thread-15008-1-1.html

如何求一个分店的附件一百米所有的分店ID
http://www.aboutyun.com/thread-15033-1-1.html

Mahout 源码位置
http://www.aboutyun.com/thread-15030-1-1.html

关于HBase存储的列族设计
http://www.aboutyun.com/thread-15027-1-1.html

hive如何支持循环
http://www.aboutyun.com/thread-15026-1-1.html

2015年about云8月第4周

hadoop mapreduce的本地模式及yarn模式
http://www.aboutyun.com/thread-14792-1-1.html
1.本地模式与Yarn模式配置有什么区别？
2.Yarn模式有哪两种方式执行任务？
3.uber mode与mr小作业是什么关系？

腾讯游戏使用Docker的？
http://www.aboutyun.com/thread-14799-1-1.html
1.腾讯游戏是什么时候开始使用Docker的？
2.Docker在游戏的业务中有什么样的优势？
3.腾讯游戏的Docker应用场景是怎么样的？
4.腾讯内部推进Docker过程中遇到过哪些阻力？是如何解决的？
5.腾讯使用Docker过程中有哪些坑？做哪些重点改进？

hadoop大数据、云技术基础集群搭建之环境变量
http://www.aboutyun.com/thread-14786-1-1.html
1.什么是环境变量？
2.环境变量的作用是什么？
3.举例集群安装中碰到的此类问题？

你应该掌握的七种回归技术
http://www.aboutyun.com/thread-14867-1-1.html
1.什么是回归分析？
2.我们为什么使用回归分析？
3.我们有多少种回归技术？

Hadoop Web项目--Mahout0.10 MR算法集锦
http://www.aboutyun.com/thread-14830-1-1.html
1、Hadoop Web项目开发的软件环境。
2、该项目是如何调用Mahout0.10的MR算法？
3、如何把MR算法嵌入到Web项目中？
4、如何实现附带数据生成及数据查看、MR 任务监控等功能？

hadoop高级命令详解
http://www.aboutyun.com/thread-14829-1-1.html
1.hadoop Archive的作用是什么？
2.怎么使用hadoop Archive？
3.怎么查找Archive文件？
4.怎样解压Archive文件？
5.本文还介绍了哪些命令？

云计算1.0时代已过，2.0时代来临
http://www.aboutyun.com/thread-14816-1-1.html
1.云计算1.0到2.0时代有什么变化？
2.云计算2.0的标志是什么？
3.你认为几年内能进入云计算3.0？

redis在学生抢房应用中的实践小结
http://www.aboutyun.com/thread-14812-1-1.html
1.redis常用的分布式锁的实现方式有哪些？
2.如何保证内存一致性？
3.如何保证数据一致性？
4.DDOS黑名单是怎么设计的？
5.如何处理关系查询？
6.如何使用事务？

hadoop 断电宕机处理【工作经验分享】
http://www.aboutyun.com/thread-14801-1-1.html

高效程序员的狂暴之路
http://www.aboutyun.com/thread-14794-1-1.html

资源：

腾讯云实践之路-刘颖
http://www.aboutyun.com/thread-14836-1-1.html

云机：用友公有云平台虚拟机系统-薛正华
http://www.aboutyun.com/thread-14837-1-1.html

OpenVswitch(文档密码：aireal123456
http://www.aboutyun.com/thread-14808-1-1.html

中国电信大数据整体介绍
http://www.aboutyun.com/thread-14807-1-1.html

[机器学习.汤姆·米切尔].McGrawHill,.Tom.Mitchell.-.Machine.L【更多资源about云...
http://www.aboutyun.com/thread-14797-1-1.html

Scala例子书籍【145页】
http://www.aboutyun.com/thread-14796-1-1.html

hadoop各种测试数据下载【10种数据：包括微博关系等】
http://www.aboutyun.com/thread-14795-1-1.html

学习spark数据分析书籍下载
http://www.aboutyun.com/thread-14782-1-1.html

问答：

简单的sql,group by 的结果不是想的那样啊
http://www.aboutyun.com/thread-14805-1-1.html

2015年about云8月第3周

10EB量级的基因大数据处理技术
http://www.aboutyun.com/thread-14696-1-1.html
1.我们大脑为什么会这么强?大脑的处理能力有多强?
2.大数据的含义是什么？
3.环境对人有哪些影响？
4.造成人群差异的原因是什么？
5.为什么要做精准医学？

高吞吐量系统设计优化建议
http://www.aboutyun.com/thread-14718-1-1.html
1.开辟缓冲区的目的是什么？
2.缓冲区过大有什么缺点？
3.总结高吞吐量系统该如何优化？

阿里大数据观点【ppt】
http://www.aboutyun.com/thread-14700-1-1.html
1.本文将大数据分为了哪四层？
2.如何落地大数据？
3.本文中大数据在阿里的作用是什么？

Hadoop MapReduce shell命令解析
http://www.aboutyun.com/thread-14757-1-1.html
1.如何查看mapred命令？
2. mapred pipes作用什么？
3.mapred queue的作用是什么？

高效编程秘诀
http://www.aboutyun.com/thread-14754-1-1.html
1、如何高效编程？
2、什是GDT？GTD的核心理念是什么？最核心步骤是该如何做？
3、什么是番茄工作法？

阿里感悟-如何才能晋升
http://www.aboutyun.com/thread-14769-1-1.html

沈国阳：美团推荐系统整体框架与关键工作
http://www.aboutyun.com/thread-14768-1-1.html
1、美团排序的主要工作包括什么？
2、了解美团推荐系统的整体架构。
3、美团推荐平台的特点有哪些？
4、什么是“本地人热单”策略？它是如何实现的？

Hadoop分块详解
http://www.aboutyun.com/thread-14734-1-1.html
1.hadoop分块有哪些配置决定？
2.hadoop分块具体是如何实现的？

资源：

hadoop权威指南第三版和配套源码
http://www.aboutyun.com/thread-14742-1-1.html

spark编程中文版
http://www.aboutyun.com/thread-14737-1-1.html

什么是appache phoenix
http://www.aboutyun.com/thread-14736-1-1.html

企业级搜索引擎Solr基础入门
http://www.aboutyun.com/thread-14735-1-1.html

白话虚拟化
http://www.aboutyun.com/thread-14720-1-1.html

淘宝TFS架构演进
http://www.aboutyun.com/thread-14773-1-1.html

深入Python编程
http://www.aboutyun.com/thread-14772-1-1.html

Kafka 监控工具--KafkaOffsetMonitor使用
http://www.aboutyun.com/thread-14771-1-1.html

数据中心容灾规划方案
http://www.aboutyun.com/thread-14760-1-1.html

Solr 实战2013【263页】
http://www.aboutyun.com/thread-14759-1-1.html

问答：

hive 安装出现问题，各位帮忙看看
http://www.aboutyun.com/thread-14706-1-1.html

2015年about云8月第2周

学习大数据、云技术如何提高部署学习效率
http://www.aboutyun.com/thread-14575-1-1.html
1.如何避免反复部署集群？
2.快照的作用是什么？
3.缓存服务器能起到什么作用？

每个程序员和设计师必做的10项运动
http://www.aboutyun.com/thread-14578-1-1.html

李滔：搜狐基于Spark的新闻和广告推荐实战
http://www.aboutyun.com/thread-14577-1-1.html
1.如何建立用户兴趣标签？
2.如何对用户兴趣的评估？
3.什么是ctr预测？
4.计算新闻相似度是用什么算法？

计算机科学中最重要的32个算法
http://www.aboutyun.com/thread-14589-1-1.html
1.本文哪些算法是比较常见的？
2.什么是分支界定算法（Branch and Bound）？
3.什么是期望-最大算法？

金融行业的数据挖掘之道
http://www.aboutyun.com/thread-14611-1-1.html
1、如何针对客户意见建立本体模型？
2、如何使用朴素贝叶斯挖掘客户意见？

openstack kilo可靠安装汇总：包括安装部署及遇到的问题总结
http://www.aboutyun.com/thread-14632-1-1.html

Google翻译是如何把深度学习“塞进”手机的？
http://www.aboutyun.com/thread-14625-1-1.html
1、字镜头是什么？
2、如何在手机上完成深度学习？

【Java并发编程实战】—–synchronized
http://www.aboutyun.com/thread-14623-1-1.html
1.java同步机制解决了什么问题？
2.Java中synchronized关键字的作用是什么？
3.什么是锁？

大数据的价值不在大，而在于潜在用户的挖掘
http://www.aboutyun.com/thread-14635-1-1.html

1.大数据思维是什么？

2.总结大数据与数据挖掘之间的关系？

3.广发银行为例，说明大数据的挖掘主要表现哪些方面？

大数据思维，到底是什么？
http://www.aboutyun.com/thread-14649-1-1.html

大数据云技术基础之Linux源：/etc/apt/sources.list文件
http://www.aboutyun.com/thread-14602-1-1.html
1./etc/apt/sources.list的作用是什么？
2.为什么会产生 /etc/apt/sources.list.d？
3.deb http://cn.archive.ubuntu.com/ubuntu/ precise main restricted中precise main restricted该如何解析？

如何通过MapReduce实现腾讯QQ推荐好友
http://www.aboutyun.com/thread-14583-1-1.html

Openstack J版DVR搭建流程
http://www.aboutyun.com/thread-14591-1-1.html

spark个人学习总结
http://www.aboutyun.com/thread-14584-1-1.html

问答：

mr 如何实现网站连续几日uv量统计
http://www.aboutyun.com/thread-14644-1-1.html

资源：

about云openstack入门宝典第四版_kilo版
http://www.aboutyun.com/thread-14650-1-1.html

中国行业大数据应用市场专题研究报告
http://www.aboutyun.com/thread-14619-1-1.html

NoSQL数据库笔谈v2
http://www.aboutyun.com/thread-14609-1-1.html

可视化存储智能解决方案—思路、设计与展现（By-冬瓜头）
http://www.aboutyun.com/thread-14574-1-1.html

企业云化的痛点与实践_方国伟_大型企业的基础架构演变V4.1_终稿
http://www.aboutyun.com/thread-14637-1-1.html

Spark大数据处理：技术、应用与性能优化(全)【397页】
http://www.aboutyun.com/thread-14636-1-1.html

Storm上运行SQL(日志分析)
http://www.aboutyun.com/thread-14652-1-1.html

Storm上运行SQL(滑动窗口)
http://www.aboutyun.com/thread-14651-1-1.html

云上运维专题_王为_OpenStack中的高可用与分布式三层网络
http://www.aboutyun.com/thread-14621-1-1.html

大数据量化投资：研报文本挖掘选股策略
http://www.aboutyun.com/thread-14590-1-1.html

2015年about云8月第1周

Spark SQL结构化数据分析
http://www.aboutyun.com/thread-14481-1-1.html
1.什么是DataFrame？
2.在大数据分析方面spark Sql 提供了哪些助力？
3.Spark 支持哪些数据源？
4.DataFrame有什么特点？
5.DataFrame和 RDD有哪些区别？

【微信分享】梁堰波：主流SQL on Hadoop框架选择
http://www.aboutyun.com/thread-14468-1-1.html
1.Hive on Tez 与 Hive on Spark的优劣势有哪些？
2.Spark SQL有哪些优劣势？
3.Impala有哪些优劣势？
4.SQL on Hadoop解决方案选择的依据是什么？
5.impala最大的规模多少？性能如何？
6.apache phoenix进入cloudera lab能说明什么吗？
7.刚你说到Spark做ETL的痛点，可否详细说说，除下资源预测，还有哪些？
8.根据应用场景不同，sql on hadoop架构还是混合模型的，就是多重组件同时存在？

Ambari——大数据平台的搭建利器之进阶篇
http://www.aboutyun.com/thread-14466-1-1.html
1.Ambari现在处于一个什么样的状态？
2.利用Ambari如何扩展集群？
3.Ambari有哪些自定义命令？
4.Ambari 中 Service 之间是什么样的依赖关系？
5.什么是Ambari的维护模式？
6.应用：如何快速搭建 Spark on YARN 的集群？

【Spark】RDD操作详解1——Transformation和Actions概况
http://www.aboutyun.com/thread-14522-1-1.html
1、Spark算子的作用是什么？
2、什么是Transformation和Actions？
3、算子分类有哪些？

为什么程序员也能成为伟大的CEO
http://www.aboutyun.com/thread-14512-1-1.html

【Spark Core】从作业提交到任务调度完整生命周期浅析
http://www.aboutyun.com/thread-14461-1-1.html
1.Spark作业提交到执行是一个怎样的过程？
2.Driver任务提交是一个怎样的过程？
3.作业从提交到任务调度经历了一个怎样的生命周期？

从Hadoop到Spark的架构实践
http://www.aboutyun.com/thread-14423-1-1.html

Spark Core源码分析: Spark任务模型
http://www.aboutyun.com/thread-14460-1-1.html
1.Task是如何实现的？
2.重要外部类有哪些？
3.进程模型与线程模型有哪些优劣势？

大数据的梦想与现实（上）：大数据技术篇
http://www.aboutyun.com/thread-14502-1-1.html
1、传统BI的数据处理方式是怎样的？
2、大数据解决方案有哪几种？
3、大数据的市场行情如何？

HDFS Snapshot原理
http://www.aboutyun.com/thread-14495-1-1.html
1.快照的作用是什么？
2.HDFS Snapshot的原理是什么？

Spark与Flink：对比与分析
http://www.aboutyun.com/thread-14483-1-1.html
1.Spark 1.4有哪些特点？
2.Flink 0.9有哪些特点？
3.Spark与Flink分析对比是什么？

程序员，为什么千万不要重写代码？
http://www.aboutyun.com/thread-14482-1-1.html
1.为什么你觉得旧代码异常混乱？
2.新代码一定比旧代码好？
3.当你觉得眼前的旧代码很烂时，该怎么办？

学习大数据、云技术如何提高部署学习效率
http://www.aboutyun.com/thread-14575-1-1.html
1.如何避免反复部署集群？
2.快照的作用是什么？
3.缓存服务器能起到什么作用？

来自大数据的反思：需要你读懂的10个小故事
http://www.aboutyun.com/thread-14550-1-1.html

Twitter已经用Heron替换了Storm
http://www.aboutyun.com/thread-14532-1-1.html

腾讯蓝鲸数据平台之告警系统
http://www.aboutyun.com/thread-14529-1-1.html
1、数据平台告警系统采用什么监控工具监控哪些方面？
2、采用什么监控指标和策略？
3、不同的异常判断各有优缺点，总结并比较。

七牛是如何搞定每天500亿条日志的
http://www.aboutyun.com/thread-14563-1-1.html
1、Flume和Kafka使用要点有哪些？
2、数据离线和实时计算采用什么方法？
3、Flume＋Kafka＋Spark 结合起来是如何处理500亿条日志？

每个程序员和设计师必做的10项运动
http://www.aboutyun.com/thread-14578-1-1.html

李滔：搜狐基于Spark的新闻和广告推荐实战
http://www.aboutyun.com/thread-14577-1-1.html
1.如何建立用户兴趣标签？
2.如何对用户兴趣的评估？
3.什么是ctr预测？
4.计算新闻相似度是用什么算法？

问答：
HIVE查询实例和Shell去重（面试题）
http://www.aboutyun.com/thread-14552-1-1.html

【MapReduce】如何随机分配数据到Reducer？
http://www.aboutyun.com/thread-14525-1-1.html

2015年about云7月第3周

新浪是如何分析处理32亿条实时日志的？
http://www.aboutyun.com/thread-14347-1-1.html

1、新浪处理日志采用的技术框架有哪些？

2、为了提供更好的服务，新浪从哪些方面入手，以及是如何实现的？

3、在本文的问答环节，你有哪些收获？

解密京东618技术：重构多中心交易平台 11000个Docker支撑
http://www.aboutyun.com/thread-14313-1-1.html
1、京东618采用的技术有哪些？
2、京东如何在高强度的负载压力下，保证业务系统的平稳运行？
3、后端运营的核心是什么？
4、流量压测发现的瓶颈是什么？京东提出了怎样的解决方案？
5、交易系统的优化方案有哪些？
6、希望读者阅读完本文后，进行相关总结。

机器学习和统计模型的差异
http://www.aboutyun.com/thread-14308-1-1.html
1、什么是机器学习、统计模型？
2、从本文中的商业案例中理解统计模型和机器学习算法的差别？
3、机器学习和统计模型的差异有哪些？

程序员，为未来准备好了吗？
http://www.aboutyun.com/thread-14301-1-1.html

Linux必知的29个命令
http://www.aboutyun.com/thread-14300-1-1.html
1.ps命令是什么意思？
2.df命令的含义是什么？
3.uname会显示什么信息？

Apache Spark新手入门攻略【推荐】
http://www.aboutyun.com/thread-14294-1-1.html
1、为什么要使用Apache Spark？
2、Spark如何工作？
3、如何安装Spark？
4、什么是弹性分布式数据集RDD？

spark 安装部署详细文档
http://www.aboutyun.com/thread-14291-1-1.html
1、spark job的生成和运行是怎样的？
2、如何编译spark？
3、kafka和sparkstreaming怎样结合？

hadoop2.7.1源码分析之自带mapreduce(wordcount)解析【最新最详细注释】
http://www.aboutyun.com/thread-14277-1-1.html
1.hadoop2.7.1是否支持多路径输入？
2.下面代码中包含几个泛型类？
3.如何区分输入与输出路径？

hadoop学习之基础Java GC详解
http://www.aboutyun.com/thread-14276-1-1.html
1.HotSpot上的分代分为哪三个部分？
2.评估GC性能的指标有哪几个？
3.年老区和永久区使用的是什么算法？

about云源码分析之hadoop2.x（2.7.1为例）二次开发：hadoop是如何定义命令行的
http://www.aboutyun.com/thread-14260-1-1.html

about云源码分析之hadoop2.x（2.7.1为例）二次开发基础：命令行添加
http://www.aboutyun.com/thread-14259-1-1.html
1.Apache Commons CLI 如何被定义？
2.CLI 命令代码实现流程是什么？
3.Options 类的作用是什么？

about云源码分析之hadoop2.7.1 mapreduce（wordcount为例）
http://www.aboutyun.com/thread-14258-1-1.html
1.你认为GenericOptionsParser类的作用是什么？
2.Options类你认为它的作用是什么？
3.提交job中，面对多输入路径，如何区分输入输出路径？

史上最全的程序员求职渠道总结
http://www.aboutyun.com/thread-14315-1-1.html

about云hadoop源码分析之mapredue的泛型类解析【hadoop2.7.1】
http://www.aboutyun.com/thread-14243-1-1.html
1.什么是泛型？
2.什么是泛型接口类？
3.Mapper<Object, Text, Text, IntWritable>是一个什么类？

hadoop2.7.1（稳定版）汇总：安装包、源码包、API、新能功能及改变
http://www.aboutyun.com/thread-14234-1-1.html

hadoop2.7.1发布
http://www.aboutyun.com/thread-14225-1-1.html

美团面试中被问到的问题汇总
http://www.aboutyun.com/thread-14342-1-1.html

资源：

HBase二级索引实现方案
http://www.aboutyun.com/thread-14321-1-1.html

scala本质（2015）【英文】
http://www.aboutyun.com/thread-14303-1-1.html

系统和网络管理
http://www.aboutyun.com/thread-14286-1-1.html

最新100份开源大数据架构论文之50:sosp_spark_streaming
http://www.aboutyun.com/thread-14285-1-1.html

最新100份开源大数据架构论文之48:Storm @Twitter
http://www.aboutyun.com/thread-14283-1-1.html

OpenStack实战指导手册
http://www.aboutyun.com/thread-14269-1-1.html

CDH5.3离线安装指南
http://www.aboutyun.com/thread-14268-1-1.html

OpenStack 架构设计指南【20150711】
http://www.aboutyun.com/thread-14254-1-1.html

离散数学及其应用下载
http://www.aboutyun.com/thread-14240-1-1.html
Spark快速数据处理
http://www.aboutyun.com/thread-14366-1-1.html

Linux教程
http://www.aboutyun.com/thread-14369-1-1.html

半小时理解Neutron代码结构
http://www.aboutyun.com/thread-14339-1-1.html

大数据处理与分析系列分享：大数据处理与分析概览--冯振华V1.1
http://www.aboutyun.com/thread-14338-1-1.html

问答：

安装集群监控ganglia遇到问题
http://www.aboutyun.com/thread-14228-1-1.html

about云2015年07月第二周经典回顾

about云源码分析之hadoop2.7.1 mapreduce（wordcount为例）新写法
http://www.aboutyun.com/thread-14258-1-1.html
1.你认为GenericOptionsParser类的作用是什么？
2.Options类你认为它的作用是什么？
3.提交job中，面对多输入路径，如何区分输入输出路径？

about云源码分析之hadoop2.x（2.7.1为例）二次开发基础：命令行添加
http://www.aboutyun.com/thread-14259-1-1.html
1.Apache Commons CLI 如何被定义？
2.CLI 命令代码实现流程是什么？
3.Options 类的作用是什么？

about云源码分析之hadoop2.x（2.7.1为例）二次开发：hadoop是如何定义命令行的
http://www.aboutyun.com/thread-14260-1-1.html

about云hadoop源码分析之mapredue的泛型类解析【hadoop2.7.1】
http://www.aboutyun.com/thread-14243-1-1.html
1.什么是泛型？
2.什么是泛型接口类？
3.Mapper<Object, Text, Text, IntWritable>是一个什么类？

HDFS小文件处理解决方案总结
http://www.aboutyun.com/thread-14227-1-1.html

1、HDFS处理小文件有几种方案？各自的优缺点有哪些？

2、HDFS文件操作流程步骤有哪些？

3、你对提高HDFS处理小文件的效率有什么新的想法？

通过可视化来了解你的Spark应用程序
http://www.aboutyun.com/thread-14218-1-1.html

1.spark可视化带来的提升主要包括哪三个部分？

2.时间轴视图可以覆盖哪3个等级？

3.Spark events时间轴视图反映了哪些内容？

学习hadoop2.7 API:通过eclipse查看hadoop2.7 包及 wordcount例子源码
http://www.aboutyun.com/thread-14200-1-1.html
1.获取查看hadoop2.7 jar包对应的源码？
2.如何获取hadoop2.7 wordcount例子?

软件开发者的四大“看家本事”
http://www.aboutyun.com/thread-14199-1-1.html
1.本文讲了哪四大技能？
2.你认为该如何具备这四种技能？
3.除了本文涉及技能，你认为还需要哪些技能？

最牛B的编码套路
http://www.aboutyun.com/thread-14184-1-1.html
1.本文编码套路是什么？
2.为什么天天编程，不足以成为专业程序员？
3.程序员该如何锻炼成为专业程序员？

Linux中如何安装eclipse
http://www.aboutyun.com/thread-14160-1-1.html
1.如何从window复制到Linux？
2.如何在Linux中安装eclipse？
3.如何创建快捷方式？

about云系列spark入门2：spark最新源码包、安装包、git源码、maven等下载介绍
http://www.aboutyun.com/thread-14137-1-1.html
1.spark安装包如何下载？
2.如何git下载源码包？
3.如果通过maven下载spark？

about云系列spark入门3：Spark SQL处理结构化数据的spark模块
http://www.aboutyun.com/thread-14141-1-1.html
1.在spark程序中，如何使用spark sql?
2.spark对于不同的数据源是如何处理的？
3.spark sql是否支持 JDBC 和 ODBC?

about云系列spark入门4：Spark Streaming介绍
http://www.aboutyun.com/thread-14158-1-1.html
1.spark Streaming支持哪些语言？
2.spark Streaming是否具有故障恢复功能？

如何反编译hadoop2.x(2.7为例)安装包自带wordcount
http://www.aboutyun.com/thread-14156-1-1.html
1.如何查看hadoop带自带例子源码？
2.本文使用的什么工具进行反编译？
3.hadoop2.7如何实例化job的？

招聘初级程序员必须考虑的6个因素
http://www.aboutyun.com/thread-14136-1-1.html

HBase在线数据备份
http://www.aboutyun.com/thread-14135-1-1.html
1.Hbase备份能解决哪些问题？
2.Hbase在线备份有哪几种方式？
3.Hbase在线备份方案有哪些区别？
4.Hbase如何部署？

hadoop2.7.1发布
http://www.aboutyun.com/thread-14225-1-1.html

about云系列spark入门5：MLlib 介绍
http://www.aboutyun.com/thread-14183-1-1.html

能在编程之路走得更远的迹象
http://www.aboutyun.com/thread-14181-1-1.html

问答：

Linux下eclipse运行mapreduce问题记录【hadoop2.7】
http://www.aboutyun.com/thread-14194-1-1.html

hive创建mapreduce 为0个。有详细日志。求分析为何原因？
http://www.aboutyun.com/thread-14178-1-1.html

kafka删除节点怎么删除啊
http://www.aboutyun.com/thread-14177-1-1.html

hive运行job的时候报错
http://www.aboutyun.com/thread-14172-1-1.html

资源：

OpenStack 架构设计指南【20150711】
http://www.aboutyun.com/thread-14254-1-1.html

离散数学及其应用下载
http://www.aboutyun.com/thread-14240-1-1.html

hadoop2.7.1（稳定版）汇总：安装包、源码包、API、新能功能及改变
http://www.aboutyun.com/thread-14234-1-1.html

最新100份开源大数据架构论文之36:ZooKeeper：Wait-free coordination
http://www.aboutyun.com/thread-14185-1-1.html

最新100份开源大数据架构论文之35:在云环境中的MapReduce
http://www.aboutyun.com/thread-14165-1-1.html

最新100份开源大数据架构论文之34：Job Scheduling for Multi-User MapReduce Clus...
http://www.aboutyun.com/thread-14144-1-1.html

最新100份开源大数据架构论文之33:Hadoop Fair Scheduler Design Document
http://www.aboutyun.com/thread-14143-1-1.html

最新100份开源大数据架构论文之43:MapReduce Simplied Data
http://www.aboutyun.com/thread-14223-1-1.html

openstack测试要点
http://www.aboutyun.com/thread-14221-1-1.html

概率论与数理统计(浙大四版)
http://www.aboutyun.com/thread-14208-1-1.html

Shell_教程系列30：常用shell命令
http://www.aboutyun.com/thread-14164-1-1.html

Shell_教程系列29：cgi 脚本
http://www.aboutyun.com/thread-14142-1-1.html

Shell_教程系列汇总
http://www.aboutyun.com/thread-14190-1-1.html

大数据时代的技术变革和IT人的挑战
http://www.aboutyun.com/thread-14189-1-1.html

AWS迷你书：设计模式、高可用性、高弹性、运维、监控与自动化-InfoQ
http://www.aboutyun.com/thread-14167-1-1.html

Linux shell初学从入门到精通【468页】
http://www.aboutyun.com/thread-14166-1-1.html

hadoop2.6 window下eclipse开发hadoop需要添加的组件
http://www.aboutyun.com/thread-14155-1-1.html

hadoop集群安装重启后，找不到namenode进程
http://www.aboutyun.com/thread-14149-1-1.html

Scala编程(中文版)
http://www.aboutyun.com/thread-14145-1-1.html

about云2015年07月第一周经典回顾

about云推出大数据hadoop生态系统零基础学习视频
http://www.aboutyun.com/thread-14119-1-1.html

about云系列spark入门1：初步介绍及相关文档、安装包、例子、spark库等初步介绍
http://www.aboutyun.com/thread-14046-1-1.html
1.spark速度快的原因是什么？
2.spark有哪些组件？
3.spark可以使用哪些开发语言？

程序员获取新编程技能的5个技巧？
http://www.aboutyun.com/thread-14075-1-1.html

用 Ganglia 监控基于 Biginsights 的 HBase 集群性能
http://www.aboutyun.com/thread-14074-1-1.html
1.BigInsights和HBase的区别有哪些？
2.Ganglia如何部署？

Redis系统入门介绍
http://www.aboutyun.com/thread-14112-1-1.html
1.Redis数据类型有哪些？
2.本文使用Redis完成哪些功能?
3.Redis中什么是散列类型?

Hadoop可视化分析利器之Hue
http://www.aboutyun.com/thread-14108-1-1.html
1.什么是Hue？
2.Hue的作用是什么？
3.如何配置Hue？

浅谈深度学习技术及其应用
http://www.aboutyun.com/thread-14096-1-1.html
1.什么是深度学习？
2.深度学习的发展到了什么程度？
3.深度学习的优势是什么？

苏宁张小斌：OpenStack实践基础知识（三）
http://www.aboutyun.com/thread-14090-1-1.html
1.Openstack仍然会给企业带来的问题是什么？
2.构建在IaaS上的Openstack能做些什么？
3.Openstack的创新点该如何走下去？
4.如何规范、适合的使用Openstack？

about云2015年07月02日每日一读
http://www.aboutyun.com/thread-14080-1-1.html

是时候给糟糕的技术面试来场革命了
http://www.aboutyun.com/thread-14049-1-1.html
1、传统的技术面试是怎样的？
2、一个好的应聘流程应该怎样？

OpenStack在小米私有云平台的实践
http://www.aboutyun.com/thread-14039-1-1.html
1.如何选择块存储？
2.操作系统的选择是什么？
3.如何实现的对象存储？

hbase问题总结及解决办法
http://www.aboutyun.com/thread-14036-1-1.html

离线安装Cloudera Manager5.3.4与CDH5.3.4（一）
http://www.aboutyun.com/thread-14024-1-1.html
1、前期准备工作有哪些？
2、如何安装与配置Cloudera Manager Server？
3、如何安装Agent？

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）
http://www.aboutyun.com/thread-14029-1-1.html
1、如何制作本地源？
2、如何安装CDH？
3、怎么样检查Hue？

推荐系统开发的十个关键点
http://www.aboutyun.com/thread-14025-1-1.html
1.推荐系统使用了哪些技术？
2.用户行为数据，细分为哪两部分？
3.多模型融合技术使用了哪些具体技术？

程序员的幸福年代:中国科技人才薪酬直逼硅谷
http://www.aboutyun.com/thread-14022-1-1.html

Linux命令行的艺术（使用各种命令总结）
http://www.aboutyun.com/thread-14010-1-1.html
1.本文列举了哪些日常使用命令？
2.文件及数据处理使用了哪些命令？
3.系统调试涉及哪些命令？

如何使用分层存储，让 HDFS 变得更高效？
http://www.aboutyun.com/thread-13997-1-1.html
1.HDFS分层存储是如何工作的？
2.如何基于数据使用频率来优化大数据存储？
3.eBay是如何分层存储的？

资源：

R语言编程艺术【312页】
http://www.aboutyun.com/thread-14117-1-1.html

最新100份开源大数据架构论文之20:DAmazons的高可用 Key-value存储
http://www.aboutyun.com/thread-14031-1-1.html

Shell_教程系列23:023-调试脚本
http://www.aboutyun.com/thread-14006-1-1.html

Shell_教程系列24：shell嵌入命令
http://www.aboutyun.com/thread-14030-1-1.html

Shell_教程系列25：第25章深入讨论<<
http://www.aboutyun.com/thread-14051-1-1.html

Shell_教程系列26：shell 工具
http://www.aboutyun.com/thread-14078-1-1.html

Shell_教程系列27：几个脚本例子
http://www.aboutyun.com/thread-14099-1-1.html

Shell_教程系列28：运行级别脚本
http://www.aboutyun.com/thread-14116-1-1.html

数据挖掘实操
http://www.aboutyun.com/thread-14100-1-1.html

最新100份开源大数据架构论文之18:批处理框架和mapreduce在线计算18
http://www.aboutyun.com/thread-14004-1-1.html

最新100份开源大数据架构论文之19:大型数据管理系统的研究数据应用
http://www.aboutyun.com/thread-14005-1-1.html

最新100份开源大数据架构论文之21:Cassandra - A Decentralized Structured Storag
http://www.aboutyun.com/thread-14032-1-1.html

最新100份开源大数据架构论文之22:Serving Large-scale Batch Computed Data with ...
http://www.aboutyun.com/thread-14033-1-1.html

最新100份开源大数据架构论文之25:MongoDB_Architecture_Guide
http://www.aboutyun.com/thread-14076-1-1.html

最新100份开源大数据架构论文之28:YARN一个资源管理器
http://www.aboutyun.com/thread-14098-1-1.html

spark大数据平台
http://www.aboutyun.com/thread-14042-1-1.html

浙大数据挖掘视频教程（28讲）
http://www.aboutyun.com/thread-14007-1-1.html

数据挖掘__R语言实战书籍下载【305页】
http://www.aboutyun.com/thread-14079-1-1.html

centos7.1安装openstack-kilo详细步骤
http://www.aboutyun.com/thread-14069-1-1.html

about云8-mysql安装
http://www.aboutyun.com/thread-14027-1-1.html

问答：

hive 任务调度
http://www.aboutyun.com/thread-14082-1-1.html

关于mapreduce哈希分区
http://www.aboutyun.com/thread-14072-1-1.html

storm logviewer 通过ui 访问不到日志链接
http://www.aboutyun.com/thread-14061-1-1.html

CDH集群配置openldap问题
http://www.aboutyun.com/thread-14058-1-1.html

linux定时任务 shell编写。求大神出山！
http://www.aboutyun.com/thread-14045-1-1.html

求助：用mapreduce处理数据，有些数据本身的原因会出异常，怎么知道是哪些数据出
http://www.aboutyun.com/thread-14044-1-1.html

求助，关于hbase的versions问题
http://www.aboutyun.com/thread-14015-1-1.html

neutron 搭建完成后无法ping通 router gateway
http://www.aboutyun.com/thread-14002-1-1.html

hive --service hiveserver2 启动报错
http://www.aboutyun.com/thread-13995-1-1.html

about云2015年06月第四周经典回顾

5亿整数的大文件，怎么排？
http://www.aboutyun.com/thread-13904-1-1.html
1.遇到数量巨大文件时该如何排序？
2.经典算法是否适用于大数量的文件排序？
3.外部排序是如何处理这种问题的？

Apache Hadoop准实时数据处理的架构模式
http://www.aboutyun.com/thread-13908-1-1.html

1.本文分为哪四种流处理模式？

2.什么是流采集？

3.基于外部环境的准实时事件处理与准实时基于外部环境的分割化的事件处理区别是什么？

深入理解并行编程-分割和同步设计（二）
http://www.aboutyun.com/thread-13958-1-1.html
1.分割策略的同样方法有哪些？
2.双端队列的争议是什么？
3.分割策略的争议是什么？

Tachyon：Spark生态系统中的分布式内存文件系统
http://www.aboutyun.com/thread-13949-1-1.html
1.Tachyon是什么？
2.Tachyon是如何设计的？
3.Tachyon在百度内部是如何使用的？

怎样利用Spark Streaming和Hadoop实现近实时的会话连接
http://www.aboutyun.com/thread-13883-1-1.html
1、怎么设置Spark Streaming？
2、如何实现字符串解析？
3、怎样产生sessions？

分布式存储系统事务时序
http://www.aboutyun.com/thread-13874-1-1.html
1、单机场景下是否存在时序问题？
2、多机场景下如何满足Linearizability？
3、如何没有TrueTime，怎么做到Linearizability？

大型网站架构体系的演变
http://www.aboutyun.com/thread-13972-1-1.html

问答：

hadoop+hbase运行时总是任务失败
http://www.aboutyun.com/thread-13960-1-1.html

hbase高并发操作问题
http://www.aboutyun.com/thread-13920-1-1.html

network节点连通性问题
http://www.aboutyun.com/thread-13918-1-1.html

在hadoop测试map如都测的代码，报java.io.IOExceptionType mismatch in key fro
http://www.aboutyun.com/thread-13962-1-1.html

资源：

hadoop、hbase、hive、zookeeper版本对应关系续(最新版)
http://www.aboutyun.com/thread-13935-1-1.html

商品推荐算法&推荐解释
http://www.aboutyun.com/thread-13933-1-1.html

深入理解并行编程V1.0
http://www.aboutyun.com/thread-13950-1-1.html

Shell_教程系列15：第15章引号
http://www.aboutyun.com/thread-13886-1-1.html

Shell_教程系列16：基础shell编程
http://www.aboutyun.com/thread-13887-1-1.html

Shell_教程系列7:017-条件测试
http://www.aboutyun.com/thread-13912-1-1.html

Shell_教程系列十八:：第18章控制流结构
http://www.aboutyun.com/thread-13932-1-1.html

Shell_教程系列19：第19章shell 函数
http://www.aboutyun.com/thread-13951-1-1.html

Shell_教程系列20：第20章向脚本传递参数
http://www.aboutyun.com/thread-13952-1-1.html

Shell_教程系列21：第21章创建屏幕输出
http://www.aboutyun.com/thread-13975-1-1.html

深入理解并行编程V1.0
http://www.aboutyun.com/thread-13950-1-1.html

最新100份开源大数据架构论文之一：Conquering Big Data with BDAS (Berkeley Data
http://www.aboutyun.com/thread-13913-1-1.html

最新100份开源大数据架构论文之二：Summingbird A Framework for Integrating Batc.
http://www.aboutyun.com/thread-13914-1-1.html

最新100份开源大数据架构论文之三：NoSQL Databases
http://www.aboutyun.com/thread-13916-1-1.html

最新100份开源大数据架构论文之四：Scalable SQL and NoSQL Data Stores
http://www.aboutyun.com/thread-13915-1-1.html

hadoop系列：入门hadoop ppt
http://www.aboutyun.com/thread-13888-1-1.html

机器学习中文版
http://www.aboutyun.com/thread-13971-1-1.html

杜克大学 Python 计算统计学免费电子书
http://www.aboutyun.com/thread-13970-1-1.html

about云2015年06月第三周经典回顾

推荐系统入门
http://www.aboutyun.com/thread-13780-1-1.html
1、什么是推荐？
2、推荐系统原理是什么？
3、如何评测一个推荐系统？

京东Docker扛大旗，弹性伸缩成重点
http://www.aboutyun.com/thread-13855-1-1.html
1.弹性云计算给京东带来了什么好处？
2.Docker的使用场景？
3.如何结合Docker和OpenStack？
4.缓存组件也跑在Docker中，这样做有什么好处？

新手学习编程入门最佳方式是什么
http://www.aboutyun.com/thread-13818-1-1.html

解析Apache Storm 0.10.0-beta发布：剑指Heron
http://www.aboutyun.com/thread-13817-1-1.html
1.storm在安全性方面做了哪些改进？
2.storm任务以及拓扑部署上的改进优化了哪些内容？
3.分组策略方面做了如何的改进?
4.storm通过什么方式允许hive数据接入？
5.对于Redis的支持，你认为带来什么好处？

数据分析师或者数据挖掘工程师面试都问什么问题？
http://www.aboutyun.com/thread-13792-1-1.html
1.普通的在校大学生如何才能从事数据挖掘？
2.对数据挖掘的理解是什么？
3.需要具备那些专业技能？

Kafka实战－实时日志统计流程
http://www.aboutyun.com/thread-13788-1-1.html
1.项目的整理流程是怎样？
2.flume在项目中的作用是什么以及怎么使用？
3.kafka的功能是什么？
4.storm的特点和功能有哪些？

专注做事，竟然也成为我们的稀缺能力
http://www.aboutyun.com/thread-13781-1-1.html
1、专注的现状如何？
2、我们应该怎么做？

Hadoop项目案例－用户行为分析之应用概述（一）
http://www.aboutyun.com/thread-13761-1-1.html

Hadoop项目案例－用户行为分析之应用概述（二）
http://www.aboutyun.com/thread-13762-1-1.html

快速了解Scala技术栈
http://www.aboutyun.com/thread-13756-1-1.html
1.Scala的发展如何？
2.Scala开发的框架与工具，涉及到的领域有那些？
3.Scaa在分布式系统中优势有那些？

程序员在职业生涯中如何规划自己？
http://www.aboutyun.com/thread-13743-1-1.html

小知识：

hive UDF自动增长列函数
http://www.aboutyun.com/thread-13820-1-1.html

Hive 合并输入输出文件设置
http://www.aboutyun.com/thread-13819-1-1.html

storm和spark场景选择【小知识经验总结】
http://www.aboutyun.com/thread-13772-1-1.html

Scala如何实现与JAVA交互
http://www.aboutyun.com/thread-13744-1-1.html

资源：

阿里架构师：分布式计算开源框架Hadoop 入门实践
http://www.aboutyun.com/thread-13823-1-1.html

Shell_教程系列1：001文件安全与权限
http://www.aboutyun.com/thread-13747-1-1.html

Shell_教程系列2：002-使用find和xargs【find-xargs】
http://www.aboutyun.com/thread-13748-1-1.html

Shell_教程系列3：003-cron-at-nohup后台执行命令
http://www.aboutyun.com/thread-13749-1-1.html

Shell_教程系列4：文件名置换
http://www.aboutyun.com/thread-13768-1-1.html

Shell_教程系列5：echo-管道-read-cat-tee-exec
http://www.aboutyun.com/thread-13769-1-1.html

Shell_教程系列6：006-命令执行顺序
http://www.aboutyun.com/thread-13796-1-1.html

Shell_教程系列7：007-正则表达式
http://www.aboutyun.com/thread-13797-1-1.html

Shell_教程系列8：008-grep家族
http://www.aboutyun.com/thread-13821-1-1.html

Shell_教程系列9：009-awk介绍
http://www.aboutyun.com/thread-13822-1-1.html

Shell_教程系列10：sed 用法介绍
http://www.aboutyun.com/thread-13842-1-1.html

Scala 2.11 API
http://www.aboutyun.com/thread-13841-1-1.html

about云5-安装ssh及更新软件包、openstack包
http://www.aboutyun.com/thread-13759-1-1.html

about云6-openstack环境准备-克隆虚拟机及配置
http://www.aboutyun.com/thread-13827-1-1.html

大数据在航空业有大作为
http://www.aboutyun.com/thread-13825-1-1.html

大数据项目报告样本
http://www.aboutyun.com/thread-13824-1-1.html

图流合璧——基于Spark Streaming和GraphX的动态图计算
http://www.aboutyun.com/thread-13799-1-1.html

大数据分析_天文时空数据可视化分析
http://www.aboutyun.com/thread-13798-1-1.html

hadoop-eclipse-plugin-2.7.0.jar插件分享
http://www.aboutyun.com/thread-13794-1-1.html

Packt.Machine.Learning.with.Spark
http://www.aboutyun.com/thread-13771-1-1.html

hadoop生态系统介绍【英文版132页】推荐
http://www.aboutyun.com/thread-13770-1-1.html

问答：

ganglia可以监控集群的I/O吗？
http://www.aboutyun.com/thread-13816-1-1.html

win7 eclipise远程连接虚拟机centos 7 上面搭建hadoop2.7出错求救
http://www.aboutyun.com/thread-13804-1-1.html

java程序内存使用的问题
http://www.aboutyun.com/thread-13774-1-1.html

about云2015年06月第二周经典回顾

基于HttpClient实现网络爬虫~以百度新闻为例
http://www.aboutyun.com/thread-13668-1-1.html
1.如何通过浏览器获得http请求？
2.http的请求的代码实现是什么？
3.百度新闻是如何实现这一爬虫的？

Hadoop 的 Oozie 工作流管理引擎的实际应用
http://www.aboutyun.com/thread-13665-1-1.html
1. Apache Oozie 是什么？
2. Oozie工作流有哪些形式？
3. 如何配置Oozie使用Shell、Java、Sqoop、Hive 和电子邮件操作？
4. Oozie Shell/Java/Sqoop/Hive/ 电子邮件如何操作 ?

从Hadoop到Spark的架构实践
http://www.aboutyun.com/thread-13651-1-1.html
1.基于YARN和Spark,作者认为整个数据平台达到了什么目标？
2.整个架构中，Spark Streaming主要完成了哪些工作？
3.使用Spark遇到了哪些问题？

基于Mesos和Docker的分布式计算平台
http://www.aboutyun.com/thread-13646-1-1.html
1.作为分布式架构师，分布式系统设计准则是什么？
2.Mesos是否负责任务调度？
3.分布式环境下的进程通信使用的是什么组件？

使用hadoop mapreduce实现商品统计关联度
http://www.aboutyun.com/thread-13622-1-1.html
1.如何使用mapreduce实现商品统计关联度？
2.使用mapreduce实现商品统计关联度实现的思路是什么？
3.通过map函数实现什么功能？
4.reduce在商品统计关联度中的作用是什么？

基于lucene的案例开发：纵横小说数据库设计
http://www.aboutyun.com/thread-13617-1-1.html
1.纵横小说数据库设计思路是什么？
2.四张表用来做什么的？
3.表novelchapter存储什么的？

Spark 1.4为DataFrame新增的统计与数学函数
http://www.aboutyun.com/thread-13607-1-1.html
1.Spark 1.4本文涉及了哪些函数？
2.随机数据生成函数的作用是什么？
3.为DataFrame新增加的数学函数本文介绍了哪些？

HBase在腾讯大数据的应用实践
http://www.aboutyun.com/thread-13604-1-1.html
1.为什么会选择HBase？
2.HBase易用性有哪些？
3.如何建设安全的HBase？
4.HBase在腾讯的应用场景有哪些？

openstack【juno】入门高级篇3：openstack的Neutron中虚拟网络设备介绍
http://www.aboutyun.com/thread-13596-1-1.html
1.在ovs中如何寻找对应路由？
2..在ovs中如何寻找dhcp server？
3.qr-×××的是指什么网络设备？

R语言基础编程技巧汇编（图片版、第一版）-刘宁
http://www.aboutyun.com/thread-13628-1-1.html

系统架构领域的学习材料汇总
http://www.aboutyun.com/thread-13606-1-1.html

Maven构建Hadoop Web项目
http://www.aboutyun.com/thread-13650-1-1.html

hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布式集群HA部署
http://www.aboutyun.com/thread-13679-1-1.html

小知识：

Redis优化内存的九个重点
http://www.aboutyun.com/thread-13695-1-1.html

HBase表的架构原理
http://www.aboutyun.com/thread-13678-1-1.html

利用sqoop对mysql执行DML操作
http://www.aboutyun.com/thread-13625-1-1.html

实时索引代码|mongo数据库管理源代码|IP归属地查询源代码下载
http://www.aboutyun.com/thread-13623-1-1.html

资源：

大数据系统核心技术
http://www.aboutyun.com/thread-13699-1-1.html

Storm配置详解
http://www.aboutyun.com/thread-13676-1-1.html

算法工程师综合练习卷
http://www.aboutyun.com/thread-13675-1-1.html

从数据管理视角看大数据挑战
http://www.aboutyun.com/thread-13674-1-1.html

storm实时计算英文版【336页】
http://www.aboutyun.com/thread-13664-1-1.html

Openflow协议通信流程解读
http://www.aboutyun.com/thread-13662-1-1.html

ggplot2：数据分析与图形艺术
http://www.aboutyun.com/thread-13660-1-1.html

成为真正的数据架构师需要哪些条件
http://www.aboutyun.com/thread-13616-1-1.html

VMWare-Getting-Started-with-OpenStack-and-vSphere
http://www.aboutyun.com/thread-13610-1-1.html

大数据的矩阵计算基础视频下载【40多视频】
http://www.aboutyun.com/thread-13609-1-1.html

问答：

我的DataFrame这样加过滤条件有问题吗？
http://www.aboutyun.com/thread-13614-1-1.html

Drill安装和使用，请问有哪位大侠有整理这方面的内容？
http://www.aboutyun.com/thread-13613-1-1.html

IKAnalyzer中文分词器V2012使用手册
http://www.aboutyun.com/thread-13611-1-1.html

因一块硬盘导致datanode挂了的处理
http://www.aboutyun.com/thread-13597-1-1.html

hbase关于hlog的几个疑问
http://www.aboutyun.com/thread-13600-1-1.html

about云2015年06月第一周经典回顾

经验分享：大数据如何给运营做支撑
http://www.aboutyun.com/thread-13455-1-1.html
1、企业为何要做精细化运营？
2、大数据对精细化运营的价值有哪些？
3、大数据如何驱动精细化运营？

说到人脸识别，你再也找不到一个比腾讯更大更全的人脸数据集合了
http://www.aboutyun.com/thread-13453-1-1.html
1、什么是图像识别技术？
2、图像识别技术的原理是什么？
3、图像识别技术的未来将是什么样的？

如何提升你的能力？给年轻程序员的几条建议
http://www.aboutyun.com/thread-13552-1-1.html

Hadoop实现Clustering by fast search and find of density peaks
http://www.aboutyun.com/thread-13535-1-1.html
1.Hadoop实现聚类快速搜索的思路是什么？
2.计算“局部密度距离”中，Mapper实现了什么功能？
3.如何实现根据决策图人工确定聚类个数？

小公司如何实现土豪级的灾备方案
http://www.aboutyun.com/thread-13522-1-1.html
1.云灾备有哪些优势？
2.AWS云服务是如何部署及使用的？

GC调优在Spark应用中的实践
http://www.aboutyun.com/thread-13513-1-1.html
1.spark是否兼容批处理和流式处理？
2.配置垃圾收集器时，主要有哪两种策略？
3.GC算法原理是什么？
4.spark如何根据日志进一步调优？

Twitter发布新的大数据实时分析系统Heron
http://www.aboutyun.com/thread-13509-1-1.html
1.Heron是否可以推荐storm？
2.为了美分享处理数十亿的能力，Twitter提出了几种解决方案？
3.Heron的目标是什么？
4.Heron有哪些功能？

openstack【juno】入门高级篇：为何你的实例ping不通外网【详述】
http://www.aboutyun.com/thread-13508-1-1.html
1.本文解决ping通外网的思路是什么？
2.如何实现ping通外网？
3.ping域名bad address该如何解决？

openstack【juno】入门高级篇：为何你的实例ping不通外网【概述】
http://www.aboutyun.com/thread-13489-1-1.html
1.neutron使用了哪些技术？
2.为什么ping不同外网？
3.ping不通的域名原因是什么？

使用Storm和Trident进行实时趋势分析（二）
http://www.aboutyun.com/thread-13482-1-1.html
1.如何发送日志消息给Kafka？
2.怎样进行日志拓扑分析？
3.如何使用Trident实现指数加权移动平均？
4.怎样使用storm和XMPP协议发送警报和通知？

使用Storm和Trident进行实时趋势分析（一）
http://www.aboutyun.com/thread-13479-1-1.html
1.如何发送日志消息给Kafka？
2.怎样进行日志拓扑分析？
3.如何使用Trident实现指数加权移动平均？
4.怎样使用storm和XMPP协议发送警报和通知？

数据挖掘在金融风险预警中的应用
http://www.aboutyun.com/thread-13475-1-1.html
1.什么是数据挖掘？
2.数据挖掘包含哪些流程？
3.数据挖掘常用分析方法有哪些？
4.数据挖掘在金融风险预警中如何应用？

招聘面试程序员的一些心得
http://www.aboutyun.com/thread-13478-1-1.html

程序员职业发展瓶颈：被别人信任才能有广阔未来[写给代码技术同事]
http://www.aboutyun.com/thread-13510-1-1.html

程序员：如何提高影响力，为自己代言
http://www.aboutyun.com/thread-13490-1-1.html

Spark 批量写数据入HBase
http://www.aboutyun.com/thread-13492-1-1.html

[Hive]Hive将一行记录拆分成多行
http://www.aboutyun.com/thread-13518-1-1.html

hadoop最新自测题及答案
http://www.aboutyun.com/thread-13491-1-1.html

##############
资源：

OpenStack高可用指南
http://www.aboutyun.com/thread-13556-1-1.html

自制首发《OpenStack实战指南》
http://www.aboutyun.com/thread-13548-1-1.html

奉上3本机器学习英文原版书（一）
http://www.aboutyun.com/thread-13538-1-1.html

精通Hadoop
http://www.aboutyun.com/thread-13534-1-1.html

《SAS入门到精通》系列4：sas讲义(word版23章)
http://www.aboutyun.com/thread-13533-1-1.html

《SAS入门到精通》系列3：sas讲义(word版32章)
http://www.aboutyun.com/thread-13532-1-1.html

《SAS入门到精通》系列2：SAS程序
http://www.aboutyun.com/thread-13516-1-1.html

《SAS入门到精通》系列1：知识点串讲视频及PPT【24章】
http://www.aboutyun.com/thread-13515-1-1.html

奉上两本新近的Hadoop英文原版书
http://www.aboutyun.com/thread-13512-1-1.html

搜达足球韩庆山---大数据在足球报道和比赛预测中的应用【50页】
http://www.aboutyun.com/thread-13499-1-1.html

spark机器学习算法实现【代码】
http://www.aboutyun.com/thread-13498-1-1.html

人大sas视频(高级1.1G)【限时下载】
http://www.aboutyun.com/thread-13497-1-1.html

市场细分数据分析和阐释
http://www.aboutyun.com/thread-13483-1-1.html

人大sas视频(初级、中级)
http://www.aboutyun.com/thread-13481-1-1.html

微软严治庆---让大数据为每个人服务
http://www.aboutyun.com/thread-13466-1-1.html

ASBJ2014-李申申-知乎架构变迁史
http://www.aboutyun.com/thread-13465-1-1.html

Reboot saltstack交流
http://www.aboutyun.com/thread-13464-1-1.html

Scala编程第二版【英文版883页】Programming in Scala 2nd
http://www.aboutyun.com/thread-13463-1-1.html

###############
问答：
MapReduce设置reduce任务为0运行结果解析
http://www.aboutyun.com/thread-13451-1-1.html

求助OpenStack搭建后web中没有项目
http://www.aboutyun.com/thread-13546-1-1.html

求助一个问题，nova网络ping 网关不通，但是ping物理网段内的其他机器都可以
http://www.aboutyun.com/thread-13527-1-1.html

求助帖，为何shuffle时间会是负数？
http://www.aboutyun.com/thread-13501-1-1.html

worker连不上master，已困4天
http://www.aboutyun.com/thread-13488-1-1.html

学OpenStack是学什么？
http://www.aboutyun.com/thread-13485-1-1.html

如何在项目中使用Hadoop程序
http://www.aboutyun.com/thread-13471-1-1.html

solrcloud 性能
http://www.aboutyun.com/thread-13468-1-1.html

about云2015年05月第五周经典回顾

基于SVM与人工神经网络的车牌识别介绍
http://www.aboutyun.com/thread-13410-1-1.html
1.车辆识别结合了哪些种图像处理技术？
2.车牌检测和车牌识用到了哪些技术？
3.车牌识别有哪两个主要步骤？
4.使用人工神经网络以识别字符包含哪些步骤？

人脸验证 DeepID 算法介绍及实战
http://www.aboutyun.com/thread-13390-1-1.html
1.DeepID是什么？
2.DeepID的强大的两个因素是什么?
3.拿到图片数据后，本文做了那两件事情？

Kafka+Spark Streaming+Redis实时计算整合实践
http://www.aboutyun.com/thread-13368-1-1.html
1.本文的应用场景是什么？
2.Spark Streaming中什么是DStream？
3.Spark Streaming提供了哪两种操作类型？
4.本文如何模拟向Kafka实时写入用户行为的事件数据？

大数据时代，让客户数据驱动利润奔跑——大数据分析中的陷阱
http://www.aboutyun.com/thread-13340-1-1.html
1.数据分析中，哪些数据是有用的？
2.什么是行为动机数据呢？
3.为什么不能只做观察者？

数据分析——确定分析思路
http://www.aboutyun.com/thread-13323-1-1.html
1.你认为数据分析方法的第一步是什么？本文是如何认为的？
2.进行数据分析的前提是什么？
3.你了解几种数据分析方法论，本文介绍了几种？

存储系统科普——如何设计分布式存储系统解决方案
http://www.aboutyun.com/thread-13322-1-1.html
1.在工程架构领域里.本文将存储分为几层？
2.分布式系统都需要考虑哪5个问题？
3.分布式如何解决容灾，一致性，性能等问题？

大数据Spark：动手写WordCount
http://www.aboutyun.com/thread-13319-1-1.html
1.Spark集群的执行单位是什么？
2.RDD的创建的来源是什么？
3.RDD之间是否可以转换？
4.如何实现修改spark WordCount？

基于Hadoop的社交网络的分析，Hadoop社交分析
http://www.aboutyun.com/thread-13351-1-1.html

未来10年是大数据价值变现的阶段
http://www.aboutyun.com/thread-13344-1-1.html

企业的数据挖掘测试题
http://www.aboutyun.com/thread-13334-1-1.html

2015年5月贵阳国际大数据产业博览会马云阐述对云计算大数据未来10年经济变局
http://www.aboutyun.com/thread-13365-1-1.html

hadoop编程问答总结
http://www.aboutyun.com/thread-13373-1-1.html

大数据时代，容易被数据误导的八个问题
http://www.aboutyun.com/thread-13392-1-1.html

从事云技术行业需要掌握的基本技能清单
http://www.aboutyun.com/thread-13393-1-1.html

hive中order by,sort by, distribute by, cluster by作用以及用法
http://www.aboutyun.com/thread-13315-1-1.html

小知识：

数据分析划分、目的及步骤图解
http://www.aboutyun.com/thread-13324-1-1.html

资源：

百度：Spark技术内幕
http://www.aboutyun.com/thread-13431-1-1.html

什么是“互联网+”2015【44页】
http://www.aboutyun.com/thread-13430-1-1.html

Linux控制台常用快捷键
http://www.aboutyun.com/thread-13420-1-1.html

hive优化以及执行原理
http://www.aboutyun.com/thread-13419-1-1.html

（学习）Learning Apache Mahout Classification-Packt 出版(英文书籍2015)
http://www.aboutyun.com/thread-13418-1-1.html

R机器学习书籍【1048页】英文书籍下载
http://www.aboutyun.com/thread-13395-1-1.html

【机器学习系列】logistic回归python实现及libsvm中的svm-toy尝试文档下载
http://www.aboutyun.com/thread-13394-1-1.html

亚马逊AWS你知多少？还有免费课程在线学习？
http://www.aboutyun.com/thread-13384-1-1.html

常用的数据分析方法
http://www.aboutyun.com/thread-13377-1-1.html

cProc智慧交通云平台解决方案
http://www.aboutyun.com/thread-13376-1-1.html

HBase_官方文档-中文翻译-leonarding
http://www.aboutyun.com/thread-13375-1-1.html

Sqoop1.4.5安装配置及演示
http://www.aboutyun.com/thread-13374-1-1.html

Spark介绍与应用案例分析
http://www.aboutyun.com/thread-13353-1-1.html

海云数据案例简介（大图）
http://www.aboutyun.com/thread-13352-1-1.html

自制首发《OpenStack开源云王者归来》
http://www.aboutyun.com/thread-13343-1-1.html

简单易学的机器学习算法——线性回归
http://www.aboutyun.com/thread-13342-1-1.html

深入学习MongoDB
http://www.aboutyun.com/thread-13330-1-1.html

高级Bash脚本编程指南_ch【书籍588页】
http://www.aboutyun.com/thread-13329-1-1.html

基于文本分类TFIDF方法的改进与应用
http://www.aboutyun.com/thread-13328-1-1.html

about云资源汇总指引V7
http://www.aboutyun.com/thread-13308-1-1.html

FastDFS 分布式存储实战
http://www.aboutyun.com/thread-13307-1-1.html

Elasticsearch in action
http://www.aboutyun.com/thread-13306-1-1.html

Google云计算原理
http://www.aboutyun.com/thread-13305-1-1.html

问答：

云主机ping的通三节点，但是ping不通百度
http://www.aboutyun.com/thread-13363-1-1.html

在线等，哪位大哥帮帮忙
http://www.aboutyun.com/thread-13350-1-1.html

基于Hive及Sqoop的每日PV、UV、IP定时分析
http://www.aboutyun.com/thread-13338-1-1.html

求助：搭建multi-region的openstack环境
http://www.aboutyun.com/thread-13318-1-1.html

about云2015年05月第四周经典回顾

构建安全的Kafka集群
http://www.aboutyun.com/thread-13246-1-1.html
1.Kafka框架，本文认为存在哪些安全问题？
2.本文是如何增强Kafka安全性的？
3.Broker启用Kerberos认证模式是如何配置的？

技术人员获得高薪谈判技巧
http://www.aboutyun.com/thread-13245-1-1.html

HDFS写入文件的重要概念
http://www.aboutyun.com/thread-13232-1-1.html
1.HDFS在进行block读写的时候是以什么为单位进行的？
2.HDFS客户端写文件是如何实现的？
3.上传一个文件到hdfs，一般会调用哪个类？
4.dfsclient文件是如何写入的？

做技术到底可以做到哪种地步-技术为什么越走越窄
http://www.aboutyun.com/thread-13229-1-1.html

IaaS中的统一存储：从设计到实现
http://www.aboutyun.com/thread-13227-1-1.html
1.统一存储架构如何重新设计的？
2.如何优化操作系统和Qemu？
2.本文做Ceph做了哪些优化？

Docker在美团的应用--基于容器的自动构建
http://www.aboutyun.com/thread-13226-1-1.html
1.自动部署系统解决了美团什么问题？
2.美团为什么没有用虚拟机？
3.基于Docker容器的自动构建解决了哪些问题？

小知识：

Hadoop（HDFS、YARN、HBase、Hive和Spark等）默认端口表
http://www.aboutyun.com/thread-13249-1-1.html

资源：

图像处理、分析与机器视觉(第三版中文版) 【640页限时下载】
http://www.aboutyun.com/thread-13273-1-1.html

电科华云_混合虚拟化云平台实战(openstack)
http://www.aboutyun.com/thread-13255-1-1.html

浅谈SDN，NFV与NV-薛保平
http://www.aboutyun.com/thread-13254-1-1.html

hive学习资料（视频、书籍）汇总
http://www.aboutyun.com/thread-13251-1-1.html

国外大数据产业的发展及启示
http://www.aboutyun.com/thread-13244-1-1.html

社交网络大数据建模的框架搜索
http://www.aboutyun.com/thread-13243-1-1.html

腾讯孟昭莉---大数据，大道之行
http://www.aboutyun.com/thread-13242-1-1.html

Hadoop_HDFS系统双机热备方案
http://www.aboutyun.com/thread-13237-1-1.html

Cloudera原厂入门教程-中文版v2.0
http://www.aboutyun.com/thread-13236-1-1.html

玩玩文本挖掘
http://www.aboutyun.com/thread-13235-1-1.html

[1-06][孔宇华][驾驭大数据：如何实现大数据的应用性]
http://www.aboutyun.com/thread-13234-1-1.html

hadoop面试
http://www.aboutyun.com/thread-13233-1-1.html

Openstack存储服务化实践-文震【华为】
http://www.aboutyun.com/thread-13216-1-1.html

Openstack生产环境要点及虚拟桌面简要-张子凡
http://www.aboutyun.com/thread-13215-1-1.html

问答：

请教一个openstack的网络问题
http://www.aboutyun.com/thread-13240-1-1.html

关于hive查询hbase乱码或者null的问题
http://www.aboutyun.com/thread-13221-1-1.html

about云2015年05月第三周经典回顾

基于Apache Mahout和Elasticsearch推荐系统介绍
http://www.aboutyun.com/thread-13120-1-1.html
1.哪些行业可以使用推荐？
2.电影推荐依赖于哪些观点？
3.推荐引擎的架构使用了哪些技术？
4.为了获得推荐有用的标识符，Mahout的物品相似度（ItemSimilarity）项目根据用户历史行为建立了哪三个矩阵？

OpenStack的私有云解决方案
http://www.aboutyun.com/thread-13121-1-1.html
1.为什么需要私有云？
2.开发、测试使用私有云有什么好处？
3.私有网盘对公司有什么好处？
4.如何建设私有云？
5.私有云网络是如何规划和实现高可用的？

openstack【Kilo】入门【keystone篇】五：keystone安装与配置
http://www.aboutyun.com/thread-13080-1-1.html
1.如何让keystone数据库，任何客户端都能访问，包括本地？
2.如何配置keystone？

openstack【Kilo】入门【准备篇】一： Ubuntu14.04远程连接（ssh安装）
http://www.aboutyun.com/thread-13066-1-1.html
ubuntu14.04 ssh如何安装？
扩展：
1. Ubuntu14.04与ubuntu12.04 ssh有什么区别？
2.远程连接，为什么安装ssh

openstack【Kilo】入门【准备篇】零：整体介绍
http://www.aboutyun.com/thread-13063-1-1.html
1.对于openstack新节点，安装各个组件前，需要注意什么问题？
2.本文的网段是如何划分的？

从机器学习谈起【推荐】
http://www.aboutyun.com/thread-13059-1-1.html
1.什么是机器学习？
2.机器学习的定义、范围和方法分别是什么？
3.机器学习的应用如何？
4.人工智能跟机器学习之间是什么关系？
5.机器学习的思考？

面试经验：2.5年, 从0->阿里
http://www.aboutyun.com/thread-13075-1-1.html

15个IT技术人员必须思考的问题
http://www.aboutyun.com/thread-13074-1-1.html

hadoop出现hadoop2.X部署警告： Unable to load native-hadoop library 总结
http://www.aboutyun.com/thread-13073-1-1.html

openstack【Kilo】汇总：包括20英文文档、各个组件新增功能及Kilo版部署
http://www.aboutyun.com/thread-13094-1-1.html

百度、腾讯和阿里内部的级别和薪资待遇介绍
http://www.aboutyun.com/thread-13050-1-1.html

解密 : 从互联网巨头数据挖掘类招聘笔试题目看我们还差多少知识。
http://www.aboutyun.com/thread-13090-1-1.html

聘用老程序员的4大原因
http://www.aboutyun.com/thread-13113-1-1.html

小知识：

Hadoop : 一个目录下的数据只由一个map处理
http://www.aboutyun.com/thread-13102-1-1.html

Hive数据倾斜（大表join大表）【优化】
http://www.aboutyun.com/thread-13077-1-1.html

通过自动化shell脚本,每日定时执行导入hive数据仓库
http://www.aboutyun.com/thread-13052-1-1.html

资源：

hadoop权威指南-第四版(2015)【英文805页】
http://www.aboutyun.com/thread-13156-1-1.html

数据挖掘入门文档下载
http://www.aboutyun.com/thread-13040-1-1.html

about云python大全，不用找别的资料了：上百视频及文档资料汇总
http://www.aboutyun.com/thread-13038-1-1.html

LDA算法在Mahout下的高效实现
http://www.aboutyun.com/thread-13144-1-1.html

最近出版的大数据Spark书籍
http://www.aboutyun.com/thread-13131-1-1.html

Apache Sqoop Cookbook【英文原生书籍】
http://www.aboutyun.com/thread-13124-1-1.html

spark快速数据处理
http://www.aboutyun.com/thread-13100-1-1.html

数据中心IT基础架构规划设计与实施（杭州-数据分析）
http://www.aboutyun.com/thread-13099-1-1.html

大数据旅游应用
http://www.aboutyun.com/thread-13098-1-1.html

大数据比赛15ppt下载
http://www.aboutyun.com/thread-13097-1-1.html

数据分析师成长之路2015
http://www.aboutyun.com/thread-13096-1-1.html

谁说菜鸟不会数据分析工具篇【233页】
http://www.aboutyun.com/thread-13078-1-1.html

数学之美28Google研究员吴军
http://www.aboutyun.com/thread-13076-1-1.html

OpenStack Kilo版本文档汇总：各个操作系统安装部署、配置文档、用户指南等文档
http://www.aboutyun.com/thread-13049-1-1.html

问答：

mapreduce操作hbase求指教！求大神出山
http://www.aboutyun.com/thread-13130-1-1.html

尝试通过Sqoop2向Hbase中import数据过程报错
http://www.aboutyun.com/thread-13081-1-1.html

消失的HMaster去哪了之配置Hbases常见错误和解决方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=13064

没hadoop项目经验，找工作直接醉了
http://www.aboutyun.com/thread-13048-1-1.html

HBase 出现就没的问题
http://www.aboutyun.com/thread-13046-1-1.html

Hbase 分区问题
http://www.aboutyun.com/thread-13033-1-1.html

about云2015年05月第一、二周经典回顾

2015年5月6日Google 发布Cloud BigTable：兼容HBase接口性能秒杀其它NoSQL
http://www.aboutyun.com/thread-13020-1-1.html
1.Google Cloud BigTable使用场景有哪些？
2.Cloud Bigtable是否支持SQL查询、连接和多行事务？
3.Cloud BigTable性能比HBase和Cassandra高出上百倍，你是怎么认为的？

Spark GraphX在淘宝的实践
http://www.aboutyun.com/thread-12970-1-1.html
1.分布式图计算框架的目的是什么？
2.图存储模式本文分为了哪两种？
3.什么是BSP（Bulk Synchronous Parallell）计算模式？

kafka设计解析之kafka高可用（High Availability）
http://www.aboutyun.com/thread-12952-1-1.html
1.kafka从哪个版本后有了HA？
2.Kafka为何需要High Available？
3.如何将所有Replica均匀分布到整个集群?
4.HA相关ZooKeeper结构有什么变化？
5.broker failover包含哪些过程？

Kafka入门经典教程
http://www.aboutyun.com/thread-12882-1-1.html
1.Kafka独特设计在什么地方？
2.Kafka如何搭建及创建topic、发送消息、消费消息？
3.如何书写Kafka程序？
4.数据传输的事务定义有哪三种？
5.Kafka判断一个节点是否活着有哪两个条件？
6.producer是否直接将数据发送到broker的leader(主节点)？
7.Kafa consumer是否可以消费指定分区消息？
8.Kafka消息是采用Pull模式，还是Push模式？
9.Procuder API有哪两种？
10.Kafka存储在硬盘上的消息格式是什么？

Python并发与并行的新手指南
http://www.aboutyun.com/thread-12949-1-1.html
1.download.py完成了什么功能（事情）？
2.这个功能由哪三个函数完成？
3.setup_download_dir作用是什么？
4.Python如何实现使用线程的？
5.在多台机器上运行任务可以通过Python的哪个库实现？

hadoop（2.X）2.7各个版本操作系统各个版本完全分布式集群配置说明
http://www.aboutyun.com/thread-12932-1-1.html
1.hadoop2.x集群安装准备工作是否都是一样的？都需要哪些准备？
2.hadoop2.x各个版本集群安装是否通用？
3.hadoop2.x配置文件分为哪两类？

基于消息的分布式架构介绍及案例解析
http://www.aboutyun.com/thread-12921-1-1.html
1.总结分布式架构与消息机制是什么关系？
2.哪些机制可以实现分布式调用？
3.Web Service、RPC、RESTful是否可以实现分布式调用？
4.常用的消息模式有哪些？

腾讯网站统计分析系统架构介绍
http://www.aboutyun.com/thread-12920-1-1.html

1.腾讯网站统计分析系统原理是什么？

2.腾讯网站统计分析系统日均需要处理几十万网站的上TB级数据，解决的如此大量数据的思路是什么？

3.本人认为实时计算系统的设计的要点是什么？

4.在腾讯分析系统中实时存储于显示是如何实现的？

Apache Spark是如何设计的
http://www.aboutyun.com/thread-12909-1-1.html
1.本文总结内存计算哪三个特点？
2.Apache Spark设计的思路是什么？
3.在Spark的支持算子方面有哪两大类？
4.能否总结对spark的认识？

大数据云计算时代的商机：“大数据即服务”时代即将到来
http://www.aboutyun.com/thread-12908-1-1.html
1.到底BDaas是什么呢？
2.与传统的Daas有何区别和联系呢？
3.BDaas又有什么生命力和价值呢？

Spark利用Project Tungsten将硬件性能提升到极限
http://www.aboutyun.com/thread-12893-1-1.html
1、怎么利用Memory Management和Binary Processing来提升性能？
2、apark怎么合理的利用Cache-aware computation？
3、Tungsten未来的目标是什么呢？

12306由传统框架云化迁移到内存数据平台
http://www.aboutyun.com/thread-12895-1-1.html
1、12306 混合云中有哪些启示？
2、12306系统改造迁移的方案是什么样的？
3、12306系统改造之后怎么迁移到Gemfire平台？
4、社保项目子系统改造之后怎么迁移到Gemfire云平台？

公安大数据系统介绍
http://www.aboutyun.com/thread-12888-1-1.html
1.公安有哪些方面的数据？
2.公安系统存储方面，使用了哪些技术？
3.公安数据使用状况来看，数据复用分为哪三个层级？

面向 Java 开发人员的 Scala 指南: 关于特征和行为
http://www.aboutyun.com/thread-12887-1-1.html
1、Scala 中的特征和行为重用有哪些？
2、JVM 中的特征是什么？
3、Scala 和 Java 兼容性怎么样呢？

大数据生态系统入门必看：pig、hive、hadoop、storm、mapreduce等白话诠释
http://www.aboutyun.com/thread-12869-1-1.html
1.本文是如何诠释pig与hive区别的？
2.数据分析人员使用hive还是Impala？
3.hive、pig适用哪些人群？
4.本文是如何形象比喻Impala、Presto、Drill及mapreduce的？
5.你认为流计算适用哪些场景，本文又是如何诠释的？

程序员越来越值钱了，如何才能让自己不过时？
http://www.aboutyun.com/thread-12850-1-1.html
1、程序员行业的知识芜杂海量，程序员需要抓住的不变量是？
2、大学期间我们最应该学的是什么？
3、程序员如何以不变应万变？

分享通过Facebook面试并获得Offer的经历和经验
http://www.aboutyun.com/thread-12883-1-1.html

中国在“互联网+” 美国已悄悄进入“新硬件时代”
http://www.aboutyun.com/thread-12998-1-1.html

Java多线程系列目录(共43篇)
http://www.aboutyun.com/thread-12973-1-1.html

刘鹏：第三代互联网是什么样的？
http://www.aboutyun.com/thread-12875-1-1.html

hadoop2.7集群完全分布式安装
http://www.aboutyun.com/thread-12934-1-1.html

资源：

2015 Spark技术峰会资料汇总
http://www.aboutyun.com/thread-12896-1-1.html

linux视频大全
http://www.aboutyun.com/thread-12886-1-1.html

分布式系统原理与范型__（第二版）书籍【509页】
http://www.aboutyun.com/thread-13019-1-1.html

大数据时代：feed架构最终版
http://www.aboutyun.com/thread-12969-1-1.html

第二届华东架构师大会文档资料分享
http://www.aboutyun.com/thread-12968-1-1.html

胡喜 --《支付宝高可用系统架构》-- 华东架构师大会
http://www.aboutyun.com/thread-12967-1-1.html

豌豆荚架构师：架构的指导原则
http://www.aboutyun.com/thread-12966-1-1.html

QCon北京2015（PPT）:机器学习
http://www.aboutyun.com/thread-12960-1-1.html

QCon北京2015（PPT）：新兴大数据处理技术与工具|阿里巴巴、360、百度等文档
http://www.aboutyun.com/thread-12955-1-1.html

QCon北京2015（PPT）:可扩展、高可用架构
http://www.aboutyun.com/thread-12924-1-1.html

QCon北京2015（PPT）:云计算平台构建与应用【2015年4月】
http://www.aboutyun.com/thread-12911-1-1.html

QCon北京2015（PPT）:云计算与大数据应用选型
http://www.aboutyun.com/thread-12910-1-1.html

IBM企业架构中实施大数据解决方案
http://www.aboutyun.com/thread-12918-1-1.html

云计算高可用架构设计与实践【2015年4月阿里最新资料】
http://www.aboutyun.com/thread-12884-1-1.html

openstack集群网络必备:路由知识补充
http://www.aboutyun.com/thread-12941-1-1.html

集群网络必备：防火墙基础知识补充
http://www.aboutyun.com/thread-12897-1-1.html

Kafka+FlumeNG+Storm+HBase
http://www.aboutyun.com/thread-12959-1-1.html

斯坦福讲座：聊聊硅谷创业公司和大数据的事【pdf】
http://www.aboutyun.com/thread-12872-1-1.html

回归价值本源-金融机构如何驾驭大数据【pdf】
http://www.aboutyun.com/thread-12871-1-1.html

医药-生物大数据的时代
http://www.aboutyun.com/thread-12854-1-1.html

Spark 1.X 大数据平台V2 无密码版
http://www.aboutyun.com/thread-12877-1-1.html

炼数成金spark 无密码版
http://www.aboutyun.com/thread-12878-1-1.html

炼数成金Scala课程无密码
http://www.aboutyun.com/thread-12881-1-1.html

问答：

hadoop eclipse-plugin编译失败
http://www.aboutyun.com/thread-12935-1-1.html

求Hbase集成phoenix报错，找了一下午。跪求大神出山
http://www.aboutyun.com/thread-12903-1-1.html