分享

about云每日一读汇总(第十三篇2016.04.01)

本帖最后由 helianthus 于 2016-5-11 21:44 编辑

about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)


about云2016年05月12日每日一读

人工智能大拿解答机器学习30个问答
http://www.aboutyun.com/thread-18370-1-1.html
1.强化学习是像Yann LeCun说的那样,是画龙点睛的一笔吗?
2.理解大脑对于理解深度学习来说有多重要?
3.有没有深度学习永远不能学会的东西?
4.Yoshua Bengio对于Kaggle和其他机器学习竞赛有什么看法
5.深度学习研究将去往何方?
6.一个人怎样才能开始机器学习?
7.Yoshua Bengio怎么看OpenAI?
8.目前对于深度学习的炒作是否言过其实?
9.在深度学习方面有哪些开放的研究领域?
10.深度学习能像在视觉和语音领域中那样在自然语言处理领域中取得成功吗?
11.深度学习与机器学习有怎样的不同?
12.对于正在进入机器学习领域的年轻研究人员,你有什么建议?
13.AI对人类有生存威胁吗?
14.只用一个学习算法解决问题是怎么看的?
15.在学术界做深度学习研究与在产业界相比有哪些好处和挑战?
16.机器学习算法的主要限制是它们学习需要太多的数据吗?
17.为什么非监督学习很重要?深度学习在其中起什么作用?
18.深度学习未被研究透彻的众多部分中,哪个是最令人困惑的?
19.传统的统计学习是否会在不久的将来再次战胜深度学习?
20.进入机器学习领域的年轻研究者们有什么建议?
21.一个人要怎么才能想出新的深度学习架构?只是通过试错吗?
22.在研究预料之外的实验结果时,比如觉得某个想法应该会有效、结果在实验里却没有效果,会用到什么技术?
23.深度学习之后机器学习中的“下一个”大事会是什么?
24.概率图模型是怎么看的?
25.在自然语言方面,未来的深度学习会有怎样的发展?
26.除了重构输入数据(例如像是自编码器这样的深度神经网络,其工作原理即是重构输入数据),还有其它什么任务能够证明对深度网络中的无监督学习有用?
27.认为利用AI技术能够捕捉到人类失去理性的行为和思考过程吗(例如 信任)?
28.在机器学习中解释一个模型有多重要?
29.认为有可能让算法从通常被当做是噪音的数据中提取出有用的信息吗?
30.如何让深度学习在计算能力较低的设备(如手机)上运行?


Redis协议详解
http://www.aboutyun.com/thread-18371-1-1.html
1.RESP协议如何进行描述?
2.Simple Strings怎样进行响应?
3.RESP Errors如何进行响应?
4.RESP整型如何响应?
5.RESP Bulk Strings如何响应?
6.RESP 数组是什么样?
7.在Arrays中的NULL 元素是什么样的?
8.如何向Redis服务端发送命令?
9.多命令和管道处理如何工作?
10.Inline命令如何应用?
11.PHP如何实现Redis客户端?



hive2.0安装总结
http://www.aboutyun.com/thread-18361-1-1.html

Linux装逼神器--快捷键总结
http://www.aboutyun.com/thread-18362-1-1.html

读懂前端与HTML5技术区别,玩转互联网企业
http://www.aboutyun.com/thread-18364-1-1.html

资源:

淘宝学院-大规模离线数据计算-ODPS
http://www.aboutyun.com/thread-18368-1-1.html

阿里巴巴百家讲坛-大规模离线数据计算-hadoop
http://www.aboutyun.com/thread-18369-1-1.html

问答:

CDH监护程序问题
http://www.aboutyun.com/thread-18363-1-1.html

neutron运维问题
http://www.aboutyun.com/thread-18365-1-1.html

Phoenix 启动出错
http://www.aboutyun.com/thread-18366-1-1.html

cdh的api的问题
http://www.aboutyun.com/thread-18367-1-1.html

关于Cloudera Manager安装集群目录的问题
http://www.aboutyun.com/thread-18372-1-1.html




about云2016年05月11日每日一读

朴素贝叶斯分类和预测算法的原理及实现
http://www.aboutyun.com/thread-18350-1-1.html
1、如何理解贝叶斯公式?
2、贝叶斯推断是什么?
3、贝叶斯算法如何应用到实例?



spark rdd释放说明
http://www.aboutyun.com/thread-18351-1-1.html
1.spark.cleaner.ttl为何被弃用?
2.在ContextCleaner,调用哪个函数来清除已经持久化的RDD数据?



Spark Streaming 数据清理机制
http://www.aboutyun.com/thread-18352-1-1.html
1、DStream和RDD如何理解他们的关系?
2、RDD如何在Spark Stream中产生?
3、怎么释放Cache住的RDD?


Spark在内存有限的情况下 如何处理 T 级别的数据?
http://www.aboutyun.com/thread-18354-1-1.html

资源:

算法技术手册.George.T.Heineman.扫描版
http://www.aboutyun.com/thread-18357-1-1.html


算法设计与分析基础.第二版.ANANY.LEVITIN.扫描版
http://www.aboutyun.com/thread-18358-1-1.html

问答:

如何定时清空sparkstreaming的统计结果,重新开始统计
http://www.aboutyun.com/thread-18347-1-1.html

openstack实例 为什么不能连接ipv6
http://www.aboutyun.com/thread-18348-1-1.html

pvcreate创建时报错
http://www.aboutyun.com/thread-18349-1-1.html

mapreduce实现决策树算法,求帮助
http://www.aboutyun.com/thread-18355-1-1.html

使用SparkStreaming开发时找不到ConnectionPool这个类
http://www.aboutyun.com/thread-18356-1-1.html

求助java怎么把HBase数据读出并导入Hive中
http://www.aboutyun.com/thread-18359-1-1.html



about云2016年05月10日每日一读

Hadoop获得集群NameNode和DataNode状态
http://www.aboutyun.com/thread-18336-1-1.html
1.如何配置Configuration?
2.如何获得DataNode相关信息?
3.如何获得Active NameNode?


hive1.2.1源码导入eclipse
http://www.aboutyun.com/thread-18338-1-1.html
1.如何配置 local_reposity ?
2.如何进行编译?
3.如何使用?


资源:

《Hive编程指南》pdf
http://www.aboutyun.com/thread-18339-1-1.html

《pig编程指南》pdf
http://www.aboutyun.com/thread-18340-1-1.html

R的统计分析与作图
http://www.aboutyun.com/thread-18344-1-1.html


问答:

redis内存数据库中的数据如何迁移到impala?
http://www.aboutyun.com/thread-18332-1-1.html

neutron vlan模式配置报错,以下是http错误日志,求解?
http://www.aboutyun.com/thread-18333-1-1.html

重启kafka后,消息生成者需要自己做重连?
http://www.aboutyun.com/thread-18334-1-1.html

逻辑回归参数训练过程的MapReduce并行化实现
http://www.aboutyun.com/thread-18337-1-1.html

HDFS副本问题
http://www.aboutyun.com/thread-18341-1-1.html

dashboard登录时说认证失败怎么回事
http://www.aboutyun.com/thread-18342-1-1.html

hive sellect查询表数据为null
http://www.aboutyun.com/thread-18343-1-1.html


about云2016年05月09日每日一读

运营和数据间的关系最接地气的一篇文章!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18326
1.如何用数据来指导你的运营工作?
2.怎样做专题的运营?
3.怎样做极度精细的数据分析?



hadoop的mapreduce如何自定义分割文件【改变默认按行分割】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18325
1.mapreduce处理文件是否按行分割?
2.如何事先自定义分割文件?
3.哪个函数实现了分割文件?



Redis和Memcached的区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18324
1.Redis和Memcached在网络IO模型方面有什么区别?
2.Redis和Memcached在内存管理机制上有哪些区别?
3.Redis和Memcached在集群管理中有哪些不同?




Ironic , Openstack Baremetal Hypervisor
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18317
1.什么是Ironic?
2.baremetal的部署数据流是怎样的?
3.Ironic的部署数据流是怎样的?



拓扑数据分析在机器学习中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18306
1.什么是拓扑学?
2.什么是“流行学习”?
3.TDA有什么作用?




新浪微博黄波:大数据开源技术框架选型及新浪微博的实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18307
1.使用开源技术框架有什么优势?
2.新浪常用的技术框架有哪些?
3.生产环境中的开源框架怎么样调优?




Redis 存储分片之代理服务Twemproxy 测试
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18316
1.什么是Twemproxy?
2.Twemproxy支持哪些命令?
3.怎样使用Twemproxy?



hadoop生态系统基础:Java虚拟机参数 -XX等相关参数应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18320
1.-XX表示的含义是什么?
2.本文列举了那些常用配置?




2016年about云05月第02周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18329



资源:

《HBase实战》.((美)Nick Dimiduk).[PDF]
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18310


一种基于改进的链式MapReduce的并行ETL应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18327


hadoop图像分割
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18328



问答:

hadoop启动问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18301


推荐一下有关通信产业的数据挖掘数据书籍或者资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18302


hbase的rowkey设计问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18303


openstack 如何改变实例的存储位置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18305


redis+twemproxy方式的集群的数据迁移问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18309


启动hive报错:Unable to instantiate org.apache.hadoop.hive.ql.metadata.Sessio...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18311


读取数据异常:java.lang.NumberFormatException: For input string:
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18312


新手提问关于hadoop搭建时 namenode无法正常启动的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18314


将topology上传到集群的时候报错,哪位大神帮忙解答一下??不胜感谢~
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18319


hive2.0启动问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18321


有没有人做过基于mapreduce的逻辑回归算法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18322


hadoop文件划分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18323




about云2016年05月06日每日一读


Spark性能优化:JVM参数调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18292
1. JVM分为哪几种?
2. 如何监测垃圾回收?
3. 如何优化executor内存比例
4. 更高级的垃圾回收调优有哪些?




15年编程生涯,资深架构师经验总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18295


资源:

美国俄亥俄州立大学:一个开发处理大数据软件的分析模型【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18297


facebook为什么使用hbase
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18298


问答:

hadoop两个namenode都是standby状态,DFSZKFailoverController没启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18288


使用eclipse将wordcount程序结果存入hbase时报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18289


启动虚拟机时,报如下错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18290


校园网环境搭建openstack 求助网络配置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18291


horizon SECRET_KEY 问提
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18293


javaweb整合hadoop
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18294


spark saveastextfile 完后会自动生成文件名part-00000--part-0n ,怎么自定义名称呢?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18296





about云2016年05月05日每日一读

Hadoop2.6.0中YARN底层状态机实现分析及代码示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18280

1.什么是Yarn中的事件?
2.Yarn 中的状态指的是什么?
3.什么是转换(过渡)?
4.什么是状态机?
5.如何用状态机构建?
6.什么是状态转移?



Hbase split方式及过程介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18281
1.在一个region中是否可以有一个或多个stroe?
2.什么是store?
3.一个store包含哪些内容?
4.Pre-splitting解决了什么问题?
5.Pre-splitting如何通过shell实现?
6.什么是自动splitting?
7.如何实现强制split?
8.region splits包含哪些内容?




阅读HBase源码的学习指导
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18278
1. 什么是HBase?
2. 如何熟悉所需环境?
3.怎样进行源代码准备?
4.应该关注哪些源代码?


spark 读取oracle,字段类型为Date的处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18282


资源:

百度海量数据分析语言
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18283


大数据分析:商业价值的路径
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18284



问答:
新人学习openstack一个月遇到的一些疑问,烦请诸位解答。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18277


hbase 表切分问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18275


Spark 提交任务出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18276


计算节点出现如下问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18279



关于capacityschedule队列用户映射的疑问?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18285



怎么合并parquet小文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18286





about云2016年05月04日每日一读

大数据平台搭建利器 Ambari 之 Kerberos 集成之路
http://www.aboutyun.com/thread-18261-1-1.html
1、什么是Kerberis?
2、Kerberos的认证流程有哪些?
3、Ambari与Kerberos的关系是什么?
4、如何理解Ambari Kerberos Descriptor?


K邻近(KNN)分类和预测算法的原理及实现
http://www.aboutyun.com/thread-18255-1-1.html
1、什么是K邻近算法?
2、K邻近算法如何寻找最近的邻居?
3、K邻近算法如何调整K值?



Spark函数扩展功能介绍
http://www.aboutyun.com/thread-18267-1-1.html
1.UDF对spark sql的作用是什么?
2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方?
3.如何在spark中使用UDF?


hadoop HA 备份standby node损坏,该如何修复
http://www.aboutyun.com/thread-18268-1-1.html

资源:

HDP2.2安装文档(推荐离线安装)
http://www.aboutyun.com/thread-18262-1-1.html

淘宝网:HDFS元数据的独立服务和独立持久化存储
http://www.aboutyun.com/thread-18270-1-1.html

IBM李建:大数据系统与结构【英文】
http://www.aboutyun.com/thread-18271-1-1.html


问答:

求助,spark streaming懒执行与stage的关系
http://www.aboutyun.com/thread-18259-1-1.html

hbase有没有“是否包含”过滤器
http://www.aboutyun.com/thread-18263-1-1.html

求spark 查询 dataframe 截取字符串方法
http://www.aboutyun.com/thread-18264-1-1.html

求教如何处理spark机器学习数据
http://www.aboutyun.com/thread-18272-1-1.html




about云2016年05月03日每日一读

阿里开源Zeus云梯分布式作业调度平台安装教程
http://www.aboutyun.com/thread-18248-1-1.html

Spark 数据ETL及部分代码示例
http://www.aboutyun.com/thread-18250-1-1.html
1.数据如何处理?
2.从数据中如何提取有用的特征?
3.有哪些衍生特征?



Dr.Elephant入门指南
http://www.aboutyun.com/thread-18251-1-1.html
1.什么是 Dr.Elephant?
2.为什么要使用Dr.Elephant?
3.核心功能点有哪些?



资源:

facebook实时数据分析【ppt英文版】
http://www.aboutyun.com/thread-18252-1-1.html

数据与知识工程【英文】
http://www.aboutyun.com/thread-18253-1-1.html




about云2016年05月02日每日一读

深度学习究竟是个啥?
http://www.aboutyun.com/thread-18226-1-1.html
1.什么叫做深度学习?
2.深度学习如何建模?


向大学说拜拜——大学 > 兴趣 + 时间 + 思考 + 实践
http://www.aboutyun.com/thread-18229-1-1.html
1.兴趣是最好的老师吗?
2.怎么样学好技术?


大数据,云技术基础知识:ssh解惑,到底谁免登陆谁
http://www.aboutyun.com/thread-18232-1-1.html
1.对于两台拥有公钥和私钥的密钥对,拥有私钥的客户端是否可以免密码登录公钥的客户端?
2.如果多台机器配置相互免登陆,该如何操作最简单?


Spark性能优化指南——基础篇
http://www.aboutyun.com/thread-18238-1-1.html
1.Spark调优有哪些原则?
2.Spark作业原理是什么?
3.怎样进行参数调优?


HBase BlockCache系列 - 探求BlockCache实现机制
http://www.aboutyun.com/thread-18239-1-1.html
1.HBase有哪几种BlockCache方案?
2.BucketCache怎样组织内存的?
3.怎样配置BucketCache?


关于大数据的常见误解
http://www.aboutyun.com/thread-18241-1-1.html
1. 数据和信息的关系?
2. 信息和智慧的关系?

从日志统计到大数据分析
http://www.aboutyun.com/thread-18242-1-1.html
1.怎样从零开始做大数据数据分析?
2.怎样进行利用最新的技术进行系统的架构改造?
3.怎样从零构建大数据平台?

亿级Web系统的容错性建设实践
http://www.aboutyun.com/thread-18243-1-1.html
1.什么是重试机制?
2.怎样动态剔除或者恢复异常机器?
3.怎样实现服务解耦、物理隔离?


2016年about云05月第01周经典帖子总结
http://www.aboutyun.com/thread-18244-1-1.html

资源:

大规模跨地域分布式资源的云平台技术挑战与实践-金钧
http://www.aboutyun.com/thread-18245-1-1.html

让你的应用漫步云端-闫国旗
http://www.aboutyun.com/thread-18246-1-1.html

问答:

scala 代码编译出多个class 分别有什么作用?
http://www.aboutyun.com/thread-18220-1-1.html

请教各位隐马尔可夫模型能不能在MapReduce上实现
http://www.aboutyun.com/thread-18222-1-1.html

请教各位,基于HMM的命名实体识别能在MapReduce上实现吗
http://www.aboutyun.com/thread-18223-1-1.html

求助! 如何在CDH5.5.2里配置 namenode 的HA
http://www.aboutyun.com/thread-18224-1-1.html

【着急】windows下eclipse运行Java的Spark程序不进call方法如何解决?
http://www.aboutyun.com/thread-18225-1-1.html

如何用命令修改配额
http://www.aboutyun.com/thread-18227-1-1.html

求助大神,kibana界面查询,调用的是es的什么接口??
http://www.aboutyun.com/thread-18230-1-1.html

CDH 里安装的zookeeper+solr,zookeeper里面的目录和开源版本的结构竟然不一致
http://www.aboutyun.com/thread-18231-1-1.html

求助,求助。
http://www.aboutyun.com/thread-18237-1-1.html

hive启动报警告太多了,请教如何消除
http://www.aboutyun.com/thread-18240-1-1.html



about云2016年04月29日每日一读

在首席架构师眼里,架构的本质是?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18211


技术领导力是如何炼成的?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18210

hbase数据迁移的3种方式总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18212

资源:

Hadoop Real-World 解决方案书籍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18213

hadoop初学者指南【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18214

问答:

Spark DataFrame怎么样处理中文乱码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18215

MapReduce里加入jcuda?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18216

用JProfile怎么调试spark streaming
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18217

编写完程序 能不能再网页上上传数据自动分析出结果
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18218




about云2016年04月28日每日一读


九大最适合实时大数据分析领域
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18203
1.九大最适合实时大数据分析领域是什么?
2.实时数据处理的挑战所在?
3.如何简化实现流程?


DStream, DStreamGraph 详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18206
1.本文内容适用范围是什么?
2.DStream, transformation, output operation 是什么?
3.quick example 的 transformation, output 如何解析?
4.DStream 类继承体系是什么?
5.Dependency, DStreamGraph 如何工作?


资源:

Python的Web抓取
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18204


轻量虚拟化技术:docker实战分享-陈轶飞
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18205


问答:
value 中数字的排序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18202


这个命令该怎么用呀?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18189


如何在keystone中创建用户然后把他禁用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18190


关于openstack云平台上搭建集群,集群 启动失败的解决办法。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18191


solr field compressed 选项被removed了,是否有替代的或者其他的压缩方案,求教
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18193


有没有人知道scsi是什么格式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18194


keystone创建Identity 实例服务出现HTTP500错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18195


mapreduce 的reduce中values的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18196


如何知道hbase正在split或者compaction,能够有哪里看到
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18198


下载的CentOS镜像无法使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18199


spark streaming 涨内存排查过程与疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18200


版本选择问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18201




about云2016年04月27日每日一读
一个“码农”自述的血泪史:当了35年程序员,我最大的遗憾就是没抓住机遇转行
http://www.aboutyun.com/thread-18176-1-1.html
1、程序员如何选择职业方向?
2、选择管理 or 技术专家?


内存泄漏与内存溢出
http://www.aboutyun.com/thread-18177-1-1.html
1、什么是内存泄漏、内存溢出?
2、两者之间有什么关系?
3、如何从程序上规避?


K-Means聚类算法的原理及实现
http://www.aboutyun.com/thread-18178-1-1.html
1、如何理解K-Means算法?
2、如何寻找K值及初始质心?
3、如何应用K-Means算法处理数据?



资源:

为服务架构下docker实践及docker在测试环境中的应用
http://www.aboutyun.com/thread-18185-1-1.html

为什么要云监控【英文版】
http://www.aboutyun.com/thread-18186-1-1.html

问答:

spark streaming 涨内存
http://www.aboutyun.com/thread-18175-1-1.html

hbase 如何查询某个字段在一段时间内重复只显示一次的所有内容
http://www.aboutyun.com/thread-18179-1-1.html

搭建storm遇到个问题,请教大家,共同学习,谢谢~
http://www.aboutyun.com/thread-18180-1-1.html

求组贴,hadoop下wordcount的问题
http://www.aboutyun.com/thread-18181-1-1.html

spark的gc在哪里配置,SPARK_DEAMON_JAVA_OPTS貌似不管用
http://www.aboutyun.com/thread-18183-1-1.html

求救。完全分布式hadoop2.5.2+zookeeper3.4.6+hbase1.0 HMaster老是开启一会就挂
http://www.aboutyun.com/thread-18184-1-1.html

linux如何把ip转换成域名
http://www.aboutyun.com/thread-18187-1-1.html






about云2016年04月26日每日一读

沈浩:可视化---用数据说话
http://www.aboutyun.com/thread-18167-1-1.html
1.如何发现数据可视化之美?
2.怎么用数据说话?
3.数据可视化到底是什么?


Lucene架构介绍
http://www.aboutyun.com/thread-18168-1-1.html
1.Lucene的优点有哪些?
2.对Lucene API 的调用如何实现索引?
3.如何实现搜索过程?

资源:
Hbase性能测试文档
http://www.aboutyun.com/thread-18170-1-1.html

打造极致高效的搜索系统-阿里巴巴陈超
http://www.aboutyun.com/thread-18171-1-1.html


问答:

烦请各位帮我看看安装devstack的蛋疼问题,折磨人一周了!
http://www.aboutyun.com/thread-18156-1-1.html

storm重复读取kafka数据报错
http://www.aboutyun.com/thread-18158-1-1.html

nova-compute服务无法启动
http://www.aboutyun.com/thread-18159-1-1.html

hadoop 程序结束后把结果复制到本地文件
http://www.aboutyun.com/thread-18160-1-1.html

hbase性能测试需要较大数据量,需要造数据,大家都是怎么造数据的,求教
http://www.aboutyun.com/thread-18161-1-1.html

centos7 docker数据卷挂载提示权限不足解决方法
http://www.aboutyun.com/thread-18162-1-1.html

求助!创建实例后无法启动
http://www.aboutyun.com/thread-18163-1-1.html

hbase master log中一直报出如下错误,如何修复
http://www.aboutyun.com/thread-18164-1-1.html


请教如何把.vmx(或.ovf)上传到glance镜像里面
http://www.aboutyun.com/thread-18165-1-1.html

求解答
http://www.aboutyun.com/thread-18166-1-1.html






about云2016年04月25日每日一读

联想企业网盘基于Docker构建分布式部署框架实践
http://www.aboutyun.com/thread-18134-1-1.html

Spark会把数据都载入到内存么?
http://www.aboutyun.com/thread-18137-1-1.html
1.RDD本质是什么?
2.shuffle本质是什么?
3.为什么spark容易崩溃?


Kafka vs RocketMQ—— Topic数量对单机性能的影响
http://www.aboutyun.com/thread-18139-1-1.html
1.topic是何物?
2.为什么要分区?
3.怎么样测试?


CDH集群调优:内存、Vcores和DRF
http://www.aboutyun.com/thread-18145-1-1.html
1.什么是DRF?
2.怎样进行CDH集群调优?

做好数据科学,离不开这7步
http://www.aboutyun.com/thread-18146-1-1.html
1.做好数据科学需要哪7步?
2.什么是数据科学?

PySpark处理数据并图表分析
http://www.aboutyun.com/thread-18150-1-1.html
1.什么是PySpark?
2.怎样利用PySpark处理数据并进行图表分析?
3.使用PySpark过程中需要注意哪些事项?


spark源码分析之Executor启动与任务提交篇
http://www.aboutyun.com/thread-18151-1-1.html
1.什么是Spark-submit ?
2.Executor启动流程是什么?
3.Executor怎样进行任务调度?

Spark On Yarn 如何提高CPU利用率
http://www.aboutyun.com/thread-18154-1-1.html
1. Spark On Yarn 如何提高CPU利用率


2016年about云04月第04周经典帖子总结
http://www.aboutyun.com/thread-18148-1-1.html



ubuntu16.04安装Hadoop2.7.2伪分布学习环境
http://www.aboutyun.com/thread-18143-1-1.html

ubuntu14.10安装pip+python27+ipython+scrapy+zlib-及遇到的各种问题解决
http://www.aboutyun.com/thread-18144-1-1.html

资源:

Laxcus大数据管理系统2.0
http://www.aboutyun.com/thread-18141-1-1.html

Hive 优化例子
http://www.aboutyun.com/thread-18152-1-1.html

让机器学习得更快.pdf
http://www.aboutyun.com/thread-18153-1-1.html

问答:
请大家帮帮忙openstack做块迁移报错不能远程libvirt URI
http://www.aboutyun.com/thread-18128-1-1.html


CDH5安装后各种问题,求大虾指导!!!
http://www.aboutyun.com/thread-18130-1-1.html

CDH重启后发生一系列问题!!求解答
http://www.aboutyun.com/thread-18131-1-1.html

求教如何快速得出rowkey的最大值和最小值
http://www.aboutyun.com/thread-18132-1-1.html

属于同一个hregionserver的hregion都是在同一台物理机器上的吗?
http://www.aboutyun.com/thread-18133-1-1.html

spark编程,使用java开发调用spark的执行hive的sql查询或insert操作
http://www.aboutyun.com/thread-18135-1-1.html

solrcloud使用solrj的CloudSolrServer和HttpSolrServer方式有什么区别
http://www.aboutyun.com/thread-18136-1-1.html

请各位指导一下
http://www.aboutyun.com/thread-18142-1-1.html



about云2016年04月22日每日一读

如何在云平台构建大规模分布式系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18120
1.如何在云平台构建大规模分布式系统?
2.怎么打造高性能、高可用的负载均衡集群?



支付宝架构师:从工程师到架构师的成长之路
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18118
1.架构师是否有统一的定义?
2.架构师的职责是什么?
3.架构师是如何成长的?




centos7中systemctl命令使用总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18115
1.centos7基本命令格式是什么?
2.如何使用htlp?
3.systemctl restart httpd.service对应的以前版本的命令是什么?



资源:
李成华--深度学习在自动问答系统中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18123


Hadoop分布式文件系统的模型分析

http://www.aboutyun.com/forum.php?mod=viewthread&tid=18122



问答:
创建/删除虚拟机计算节点iptables表更新问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18116


求助!真心不会改····就是说我的格式不对!!!!求好心人帮忙·········
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18119


求助,hbase无法启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18121





about云2016年04月21日每日一读

hadoop,hbase,hive,zookeeper整合可行性分析及版本确定
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18104
1.如何确定什么版本是稳定版本?
2.本文是如何确定各个版本的?
3.本文确定了哪些兼容版本?



hadoop离线数据存储和挖掘架构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18108
1、为什么要写《改为hadoop离线数据存储和挖掘架构》这篇文章?
2、基于hadoop集群下海量离线数据如何存储和挖掘分析架构?
3、我是如何理解Hadoop 离线数据存储和挖掘架构?


CDH5.7快速离线安装教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18107
1.什么是CDH?
2.搭建CDH集群 需要的基本环境是什么?
3.如何对集群进行基本的配置?
4.怎样进行Cloudera Manager安装?
5.怎样进行CDH服务安装?





德国名企SAP招聘Hadoop工程师 @上海/北京/深圳/香港
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18110


资源:
DVM:让 VM运行跟container一样
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18113

DVM:让 VM运行跟container一样
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18113



问答:
centos7安装 kilo-keystone报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18105


求指导,在执行nova image-list时出现HTTP500错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18109


phoenix对于时间类型的查询
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18111


OpenStack创建云主机错误 No valid host was found
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18098


求指导!如何学习云计算,怎样才算云计算的大牛?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18102


如何在官网的demo上通过另一台物理机增加一个存储节点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18103


devstack最新变动为什么删除了rejoin-stack.sh
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18101


关于mapreduce中进行filesystem.append
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18106





about云2016年04月20日每日一读

Hadoop列式存储引擎Parquet/ORC和snappy压缩
http://www.aboutyun.com/thread-18091-1-1.html
1、二进制列式存储引擎parquet和orc各自优劣有哪些?
2、hbase为什么选择snappy压缩方式?


数据驱动精准化营销在大众点评的实践
http://www.aboutyun.com/thread-18092-1-1.html
1、O2O营销的基本组成有哪些内容?
2、数据帮助运营和财务同事解决哪些问题?
3、美团点评外卖、微信红包如何实现精准营销?



HBase – RegionServer宕机案件侦查
http://www.aboutyun.com/thread-18093-1-1.html
1、RegionServer宕机如何精确分析故障?
2、如何从Hbase日志中排除定位问题?



资源:

王峰--计算广告技术之大数据下的短文本相关性计算【搜狗搜索】
http://www.aboutyun.com/thread-18095-1-1.html

夏粉--大规模机器学习技术
http://www.aboutyun.com/thread-18096-1-1.html

问答:

hive启动metastore所报的问题,求解决!!
http://www.aboutyun.com/thread-18094-1-1.html



about云2016年04月19日每日一读

分布式系统中负载均衡算法在高可用场景下的分析
http://www.aboutyun.com/thread-18081-1-1.html
1.为什么负载均衡重要?
2.负载均衡策略有哪些?
3.负载均衡的应用有哪些?

实用 | Cloudera产品高可用性配置(操作)
http://www.aboutyun.com/thread-18082-1-1.html
1.如何设置高可用性?
2.如何配置CDH其他组件使用HDFS高可用性?
3.如何配置Impala使用HDFS高可用性


资源:

超融合计算和存储的虚拟化平台
http://www.aboutyun.com/thread-18086-1-1.html

软件定义网络(SDN)与云安全-毛文波
http://www.aboutyun.com/thread-18087-1-1.html


问答:

新人求助:使用hive之前启动metastore和hiveserver服务报错??怎么解决??
http://www.aboutyun.com/thread-18077-1-1.html

求指导!cinder创建磁盘实例和创建块存储的区别?
http://www.aboutyun.com/thread-18078-1-1.html

初学solr启动有问题
http://www.aboutyun.com/thread-18079-1-1.html

求教!如何在openstack官网下载Openstack 的API和CLI手册(kilo版)
http://www.aboutyun.com/thread-18080-1-1.html

hive可以基于hibernate实现JAP吗?
http://www.aboutyun.com/thread-18083-1-1.html

跑mapredce 报错,求解
http://www.aboutyun.com/thread-18084-1-1.html

FLume整合Kafka出现java.lang.NoSuchMethodError: scala.Predef$.augmentString(Lj...
http://www.aboutyun.com/thread-18085-1-1.html

创建外网的子网
http://www.aboutyun.com/thread-18088-1-1.html



about云2016年04月16日每日一读

HDFS的工作原理扫扫盲
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18075
1.什么是分布式文件系统?
2.怎样分离元数据和数据?
3.HDFS的原理是什么?



2016年about云04月第03周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18071


怎么样使用 Redis 来存储和查询 ip 数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18069
1. Redis如何解决存储和查询ip?
2. 切分数据程序如何实现?
3. 查询数据程序如何实现?



针对 OpenStack 企业级云计算性能测试标准和解决方案,第 2 部分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18074
1.怎样根据性能测试需求分析制定性能测试策略?
2.云计算性能测试的指标是什么
3.计算性能测试的流程是什么?



通过demo学习OpenStack开发——单元测试
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18053
1.单元测试用例的代码架构是怎么样的?
2.单元测试的工具有哪些?


Spring Data Solr 教程: 排序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18055
1.排序条件如何定义?
2.有哪些查询方法?
3.怎么样排序动态查询的排序结果?



CONTOS7+CDH5.7 安装
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18049


Spark on YARN两种模式作业运行全过程分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18060
1.Spark on YARN客户端模式作业运行过程是什么?
2.Spark on YARN集群模式作业运行过程是什么?
3.二者的区别是什么?


淘宝高可伸缩高性能架构的相关框架介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18064
1.怎样实现应用无状态?
2.怎样进行各环节的合理拆分?
3.怎样进行配置统一管理?




针对 OpenStack 企业级云计算性能测试标准和解决方案,第 1 部分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18066
1.怎样收集云计算性能测试的需求?
2.怎样分析和定制针对 OpenStack 云计算性能测试策略?
3.怎样制定云计算性能测试的解决方案?



CDH5 新手详细安装教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18067



资源:

基于Spark_on_Yarn的淘宝数据挖掘平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18072


zookeeper入门:十个知识点介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18073



问答:

sqoop 从MySQL中导入数据到hive中,一直报链接数据库失败错误的解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18054


impala2.1可以安装在hadoop2.5.2和hive1.2.1吗??
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18045


基于key-Value store indexer ,solrcloud创建Hbase二级索引,CM停止indexer服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18048


检验cinder安装时,键入cinder service-list报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18051


请教一下网络接口为什么没有状态?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18052


spark 1.6下的streaming端口和executor问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18056


关于spark作业提交流程的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18058


neutron添加br-ex后不能上网
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18059


求助!openstack kilo版本,cinder-volume没有启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18061


求教!apt-get update && apt-get dist-upgrade更新,报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18062


CDH本地yum源搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18065


新手来报道
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18063


Linux wget下载https类型文件解决方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18068






about云2016年04月15日每日一读

Flume+Spark Steaming初探
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18034
1.怎么去测试Flume?
2.结合Flume怎么用Spark Streaming去测试?
3.怎么用Flume发送数据给Spark Streaming?



大数据的明天将驶向何方?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18037
1.大数据的方向如何?
2.大数据的各方面的应用如何?



资源:
.王栋--机器学习在美团:吃喝玩乐中的计算
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18041


英特尔-基于 Apache Spark的机器学习及神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18042




问答:
Yarn提交任务后OOM,内存我刚绝给得挺大的了。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18036


配置neutron过程,遇到: ERROR oslo_messaging._drivers.common
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18027


求助:hive增加权限控制后无法创建数据库
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18030


配置neutron组件,创建实例化网络时ping不通创建的子网
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18031


【求助】Mapreduce自定义Partition无法找到,已打包到jar包中
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18032


Hbase JPA实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18035


solrcloud中向一台发起大量请求,内部会不会自动HA
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18038


sqoop导mysql数据报错--求解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18040


实例创建成功可是控制台是novnc
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18039



about云2016年04月14日每日一读



hadoop,hbase,hive版本整合兼容性最全,最详细说明【适用于任何版本】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18015
1.hadoop与hbase哪些版本兼容?
2.hadoop与hive哪些版本兼容?
3.hbase与hive哪些版本兼容?
4.hbase与zookeeper哪些版本兼容?



StreamDM:基于Spark Streaming、支持在线学习的流式分析算法引擎
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18021
1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎?
2.StreamDM的体系架构和任务流程是什么?
3.StreamDM的关键特性和优点是什么?


解密深度学习在智能推荐系统的实践与应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18022
1.与传统的浅层机器学习相比,深度学习具有的特点是什么?
2.受限玻尔兹曼机与推荐系统是怎样的?
3.模型最优化 - 对比散度怎么找?
4.如何对比散度的并行化实现?
5.线上模型怎么融合?


linux下在压缩的文件中找乱码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18018


资源:

hadoop,hbase,hive版本整合兼容性最全,最详细说明【适用于任何版本】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18024


邓澍军--在线教育领域的机器学习应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18025



问答:

求教,带HA的Namenode节点迁移
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18014


storm和kafka集成的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18016


实例创建成功可是控制台打不开一直卡在这个界面求帮助啊,困扰我几天了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18017


spark 启动worker时出错,求解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18019


编译zookeeper源码时出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18020


spark有什么方法在rdd的partition内部去重,而不是这个rdd内部去重
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18023







about云2016年04月13日每日一读

Spark在美团的实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18007
1、美团离线计算平台架构都有那些框架?
2、为什么要使用spark架构?
3、spark推广过程中需要注意那些方面?



乐视电商云的整体架构与技术实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18008
1、电商系统的发展过程有哪些?
2、乐视电商云架构有哪些框架组成?
3、电商云平台架构有哪些?



资源:

CloudStack应用中的网络设计特点-刘宇超
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18011

从虚拟化到私有云的几大实践方法-金明
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18012




问答:
一个spark环境配置的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18010


hdfs dfsadmin -report发现只有一半的是Live Node原因记录
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18004


hive1.2.1在哈hadoop2.5.2测试inser,delete,update的失败经历,请大神支招
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18005




about云2016年04月12日每日一读

Kafka日志删除源码分析
http://www.aboutyun.com/thread-17988-1-1.html
1. Kafka如何配置日志保存的时间?
2. Kafka如何配置日志保存的大小?
3. Kafka删除日志的过程是啥?


使用ssh-keygen生成key详细说明
http://www.aboutyun.com/thread-17990-1-1.html
1.ssh-keygen -p的含义是什么?
2.如何指定密钥类型?
3.哪个参数指定key file的文件名和路径?



如何在Spring中注入ElasticSearch实例
http://www.aboutyun.com/thread-17993-1-1.html
1.如何初始化ElasticSearch的Client实例
2.如何在DAO层,引用client实例
3.spring注入的具体代码?


centos7:SSH公钥无密码认证
1.如何生成密钥对?
2.ssh localhost不成功,可能原因是什么?
3.ssh localhost警告的含义是什么?


面试干货!21个必知数据科学面试题和答案
1.面试相关的数据科学哪些?
2.面试应如何回答?
3.面试的相关内容有什么?

资源:

绝对《快学Scala》中文完整版书籍,402页清晰电子版32M
http://www.aboutyun.com/thread-17991-1-1.html

电子商务数据分析指标体系
http://www.aboutyun.com/thread-18000-1-1.html

许令波-淘宝网-Zookeeper_入门
http://www.aboutyun.com/thread-18001-1-1.html

问答:

nova 计算节点启动异常
http://www.aboutyun.com/thread-17989-1-1.html

hive启动后执行show tables;出现如下错误,请问是什么问题?
http://www.aboutyun.com/thread-17992-1-1.html

CDH中CM需要数据存储数据,都存储哪些数据
http://www.aboutyun.com/thread-17998-1-1.html

求大神:openstack Liberty出现ERROR (EndpointNotFound):
http://www.aboutyun.com/thread-17999-1-1.html

Spark submit遇到问题
http://www.aboutyun.com/thread-18002-1-1.html




about云2016年04月11日每日一读

分布式配置 tachyon 并运行Hadoop例子 MapReduce
http://www.aboutyun.com/thread-17977-1-1.html
1.怎样配置Tachyon和Hadoop?
2.怎样在在本地模式的Tachyon上运行Hadoop wordcount?
3.怎样在分布式模式的Tachyon上运行Hadoop wordcount?

机器学习——海量数据挖掘解决方案
http://www.aboutyun.com/thread-17978-1-1.html
1.机器学习分为哪几种?
2.有哪几种统计分析模型?
3.怎样合理调节模型参数?

SQL on Hadoop TPCDS性能测试
http://www.aboutyun.com/thread-17981-1-1.html
1.怎样生成测试数据?
2.SQL-on-Hbase要注意哪些事项?
3.在Hive查询hbase表中,怎样解决因为mapjion优化参数导致报错的问题?

Hadoop实际工作记录汇总
http://www.aboutyun.com/thread-17982-1-1.html
1.CDH为什么更好?
2.怎样解决低效的MapReduce Job?
3.怎样解决内存溢出?

2016年about云04月第02周经典帖子总结
http://www.aboutyun.com/thread-17984-1-1.html

资源:

云与端之变:全新的云计算开发平台-李平
http://www.aboutyun.com/thread-17985-1-1.html

大数据下,实现实时查询的NoSQL系统架构-范昂
http://www.aboutyun.com/thread-17986-1-1.html

问答:

红帽的yum不行
http://www.aboutyun.com/thread-17973-1-1.html

关于openstack官网注册成员的身份疑问
http://www.aboutyun.com/thread-17974-1-1.html

HBase 为什么会出现如下??求各位前辈指导
http://www.aboutyun.com/thread-17975-1-1.html

如何在openstack官网下载官方英文指导文档
http://www.aboutyun.com/thread-17976-1-1.html

cinder创建逻辑卷后无法挂载到实例VM
http://www.aboutyun.com/thread-17979-1-1.html

Spark求助  搜狗实验数据划分split(“\t")错误。
http://www.aboutyun.com/thread-17980-1-1.html

怎么把MapReduce的结果写入mysql
http://www.aboutyun.com/thread-17983-1-1.html




about云2016年04月09日每日一读

引爆Spark大数据引擎的七大工具
http://www.aboutyun.com/thread-17968-1-1.html
1.Spark的引擎工具有哪些?
2.每个引擎工具各有什么作用?


hadoop生态系统学习之路(七)impala的简单使用以及与hive的区别
http://www.aboutyun.com/thread-17970-1-1.html
1.impala有什么作用?
2.impala常用命令有什么?
3.impala与hive有什么区别?


资源:

存储系统的冗余和灾备----原理、实践和工具-杨钢
http://www.aboutyun.com/thread-17964-1-1.html

如何用云服务做移动APP-黄建军
http://www.aboutyun.com/thread-17965-1-1.html

问答:

CDH中是否可以安装原生的 Apache hbase或者hive组件
http://www.aboutyun.com/thread-17962-1-1.html

[问题]单节点部署openstack 1个租户创建private network上限
http://www.aboutyun.com/thread-17963-1-1.html

[问题]openstack 网络隔离
http://www.aboutyun.com/thread-17966-1-1.html




about云2016年04月08日每日一读

面试感悟----一名3年工作经验的程序员应该具备的技能
http://www.aboutyun.com/thread-17956-1-1.html
1.程序员的阶段?
2.项目经验的划分?

Redis数据介绍与指令大全
http://www.aboutyun.com/thread-17957-1-1.html
1.Redis的应用场景?
2.Redis的数据类型有哪些及操作?


资源:

用企业级存储架构大数据系统
http://www.aboutyun.com/thread-17953-1-1.html

在Windows Azure平台上实现业务创新
http://www.aboutyun.com/thread-17954-1-1.html

问答:

谁用ambari安装过impala,求指教
http://www.aboutyun.com/thread-17955-1-1.html

Phoenix使用MapReduce作业来加载数据时遇到问题
http://www.aboutyun.com/thread-17959-1-1.html

solrcloud 压力测试OOM该如何解决
http://www.aboutyun.com/thread-17960-1-1.html

openstack 租户隔离与租户内的子网隔离怎么实现的?
http://www.aboutyun.com/thread-17958-1-1.html




about云2016年04月07日每日一读

Hadoop YARN架构设计要点
http://www.aboutyun.com/thread-17948-1-1.html
1.YARN整体架构是什么?
2.如何实现YARN RPC?
3.ResourceManager内部原理是什么?
4.NodeManager内部原理是什么?
5.事件处理机制是怎样的?
6.什么是状态机?
7.NMLivelinessMonitor如何工作(源码分析)?


程序员面试千万不要犯这些错误
http://www.aboutyun.com/thread-17949-1-1.html
1. 不准备经历方面的问题为什么会影响面试?
2. 依赖于事先背诵的答案会导致什么?
3. 缺乏对面试的模拟会怎样?
4. 你在回答面试官提的问题时,有没有展现思考的过程?
5. 写代码离不开编辑器为何影响面试?
6.为何要养成良好的编程习惯?
7. 写代码,不进行测试是多么可怕?
8.如何克服总是着急忙慌?


资源:

hadoop零基础学习到上手工作
http://www.aboutyun.com/thread-17946-1-1.html

中国云计算
http://www.aboutyun.com/thread-17947-1-1.html

Openstack(liberty)+VM+ubuntu14.04上安装关键注意事项和心得二
http://www.aboutyun.com/thread-17942-1-1.html

Openstack(liberty)+VM+ubuntu14.04上安装各部分截图指导一
http://www.aboutyun.com/thread-17943-1-1.html

问答:

hadoop2.72+hbase1.2.0  habse java 连接不上
http://www.aboutyun.com/thread-17944-1-1.html

安装sqoop1.99.6遇到问题,报错如下,网上找不到任何解答
http://www.aboutyun.com/thread-17945-1-1.html

如何在hive中实现PLSQL存储过程迁移?
http://www.aboutyun.com/thread-17950-1-1.html

hadoop报错: java.lang.ArrayIndexOutOfBoundsException
http://www.aboutyun.com/thread-17951-1-1.html




about云2016年04月06日每日一读

基于Hadoop山寨Amazon S3
http://www.aboutyun.com/thread-17930-1-1.html
1、什么是S3?什么是HOS?
2、HOS的架构如何实现S3核心操作?


在 Java 应用程序中使用 Elasticsearch
http://www.aboutyun.com/thread-17931-1-1.html
1、如何理解ElasticSearch的工作原理?
2、如何从命令行访问REST API基本信息?
3、Java 应用程序如何与ElasticSearch交互?


spark配置说明
http://www.aboutyun.com/thread-17937-1-1.html
1.spark提供了哪三种方式配置系统?
2.环境变量如何配置?
3.spark.executor.memory的含义是什么?

资源:

Sqoop2 1.99.4安装与使用

Kafka自学文档


问答:


CDH5的yum源没有CentOS的,难道是和RedHat共用一个?
http://www.aboutyun.com/thread-17926-1-1.html

通过命令行,如何上传镜像文件?
http://www.aboutyun.com/thread-17927-1-1.html

求助:hbase Zookeeper Quorum localhost:2181
http://www.aboutyun.com/thread-17928-1-1.html

hive该如何应对上亿的数据记录
http://www.aboutyun.com/thread-17929-1-1.html

kafka 生产者如何持续读取数据
http://www.aboutyun.com/thread-17933-1-1.html

Spark Streaming与driver的问题
http://www.aboutyun.com/thread-17934-1-1.html

[问题]能否在两台电脑的虚拟机里搭建一套openstack
http://www.aboutyun.com/thread-17935-1-1.html

JDBC执行HQL语句与在HiveCli客户端执行HQL语句的区别
http://www.aboutyun.com/thread-17936-1-1.html  





about云2016年04月05日每日一读

基于SQL on Hadoop的数据仓库技术
http://www.aboutyun.com/thread-17919-1-1.html
1.数据仓库都有什么指标与要求?
2.数据仓库架构有哪些挑战?
3.数据仓库未来会如何?

让 BAT 的 Offer 不再难拿
http://www.aboutyun.com/thread-17920-1-1.html
1.什么是面试?
2.面试要准备什么?
3.面试后的收获有多少?



为Hadoop集群配置TEZ执行引擎
http://www.aboutyun.com/thread-17921-1-1.html
1.目前,hadoop的执行引擎都有哪些?
2.如何为hadoop配置tez执行引擎


[转载]Linux 内核的文件 Cache 管理机制介绍
http://www.aboutyun.com/thread-17924-1-1.html
1.在监控hadoop集群中job执行过程中,发现sys CPU占用率极高是什么原因?该如何分析?
2.如何理解linux文件系统cache原理?页缓存实现原理是什么?
3.linux服务器cahche占用过多导致系统内存不足时怎么办?
4.常用的监控系统资源使用情况的linux工具有哪些?


资源:

肖永红 数据堂数据服务介绍
http://www.aboutyun.com/thread-17922-1-1.html

张溪梦 Simon 增长黑客与数据驱动
http://www.aboutyun.com/thread-17923-1-1.html


about云2016年04月02日每日一读

HBase源码分析之KeyValue
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17910
1.HBase在内存中怎样实现的Key-Value存储?
2.HBase在内存中怎样实现的列存储?
2.怎样获取HBase中的数据?



Spark机器学习API之特征处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17912
1.怎样利用Spark机器学习API进行特征提取?
2.怎样利用Spark机器学习API进行特征选择?
3.Spark机器学习API中的特征选择有哪几种方法?




美团在Redis上踩过的一些坑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17906
1.怎样解决Redis周期性出现connect  timeout的问题?
2.怎样解决bgrewriteaof的问题?
3.怎样优化内存使用?
数据清洗的一些梳理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17898
1.怎么样进行数据清理?
2.数据清理要注意什么?



Redis监控工具—Redis-stat、RedisLive
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17907
1.怎样安装与配置Redis-stat?
2.怎样安装与配置Redis Live





about云每日一读汇总(第十三篇2016.04.01)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17892


Storm集群安装部署步骤【详细版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17897
1.怎么样安装Storm集群组件?
2.安装Storm集群组件需要哪些依赖?


一个SparkSQL作业的一生
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17908
1. SparkSQL作业是如何执行的?
2.SparkSQL和Hive On MapReduce的区别在哪?



2016年about云04月第01周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17916


Redis 哈希表的实现要点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17917


资源:

使用Scala编程艺术概论【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17913


MongoDB在盛大大数据量项目中的应用(郭理靖)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17915



问答:


如何测试大数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17893


hive on  spark on yarn   driver收不回来 问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17895


sdn无法创建网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17896


一个5g的表,在hive和spark查询的用时。在本地导入hive的用时是否过长??
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17899


OpenStack L 版密钥的方式无法登录
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17900


求助OpenStack L版ssh注入的服务是什么
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17902


创建实例报错找不到有效的宿主机,请大家帮帮忙,谢谢
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17904


【求助】,hadoop-2.2.0 64位安装配置完后namenode启动后自动关闭,访问不了5007...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17911


为什么没有发帖权限
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17909






about云2016年04月01日每日一读

Spark SQL UDF使用,sparksqludf使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17883
1.Spark Sql UDF怎么使用?
2.案例分析使用过程?



spark SQL Running the Thrift JDBC/ODBC server
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17882

1.Saprk怎么Running在Thrift JDBC Server上?
2.java JDBC怎么操作?


资源:


企业数据平台和spark角色-ebay
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17889


hdfs的透明压缩存储-百度
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17890


问答:

求助,启动hadoop的时候所有节点都变成了Unhealthy Nodes
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17879


请教storm原理性问题-同一个topology可以在不同的supervisor上运行吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17880


Flume,Spooldir收集发送到HDFS上,size存储太小
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17884


求助,nova服务就是起不来,是因为什么原因?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17886



Hadoop1.x.y版本的有什么同步配置工具吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17887


求教:cinder 重启后,虚拟机无法启动,iscsi盘丢失,iscsi认证失败,是什么问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17888

















已有(2)人评论

跳转到指定楼层
doscho 发表于 2016-5-19 18:18:15
好动动,学些了。整理的不错。
回复

使用道具 举报

wangb 发表于 2016-5-31 16:44:40
好动动,学些了。整理的不错
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条