分享

about云每日一读汇总(第十四篇2016.05.16)

本帖最后由 Tank_2000 于 2016-7-17 21:12 编辑


about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)

about云每日一读汇总(第十三篇2016.04.01)

about云每日一读汇总(第十四篇2016.05.16)


about云2016年07月18日每日一读

sqoop操作命令总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19190

Apache Kylin的快速入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19193
1Kylin是如何产生的?
2.什么时候会用到Apache Kylin?
3.Apache Kylin发展到了什么程度?


京东王晓雨:在云海实践Apache Kylin
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19200

1.什么是Apache Kylin?
2.Apache Kylin有哪些性能优势?
3.怎样基于Apache Kylin做二次开发?

hadoop,CDH如何实现 HDFS的Block数据balancer重分布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19194
1.如何判断一个集群是否数据倾斜?
2.balancer的原理是什么?
3.CDH集成平台如何实现数据重分布?


机器学习和图像识别是怎样彻底改变搜索的?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19198
1.机器学习在图像识别中有哪些优势?
2.Adam项目是什么?
3.怎样做到检索多种格式的电子文件?

从零开始,构建一套网红电商搜索系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19199
1.怎样从零开始,构建一套网红电商搜索系统?
2.电商平台有哪几种搜索形式?
3.电商平台怎样对搜索结果排序?

Spark 附带示例完整解释
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19201
1.怎样利用Spark分析日志文件?
2.Spark 属性配置方式有哪几种?
3.Spark作业调度的基本工作流程是什么?

资源:
数据仓库1:决策支持系统的发展
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19206

数据仓库2:数据仓库环境
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19207

问答:
sqoop导入parquet问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19191

求助hive建表失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19192



about云2016年07月15日每日一读

新浪微博混合云架构实践弹性调度介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19180
1.新浪混合云弹性调度系统架构是如何演进的?
2.新浪混合云如何将业务合理调度到计算节点上?
3.Swarm是什么?

使用Phoenix将SQL代码移植至HBase
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19182
1. HBase Shell如何使用?
2. Java如何远程连接HBase?
3. 如何安装和配置Phoenix?
4. Phoenix的语法有哪些?
5. 如何安装和使用SQuirrel?
6. 如何使用Phoenix移植SQL代码至HBase?
7. Phoenix如何进行性能调优?


资源:
dubbo视频系列之五源码及相关例子【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19183

MLlib在淘宝的应用和改进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19184

问答:
使用flume,如何保证source的各个文件在sink出去之后依然是这些文件?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19181

创建image时候--public  --share --private 该怎么用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19186

kilo版nova image-create snapshot问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19188





about云2016年07月14日每日一读

Spark 2.0技术新特性总结
http://www.aboutyun.com/thread-19170-1-1.html
1.Spark 2.0SQL做了哪些改变?
2.Spark 2.0,DataFrame、Dataset API做了哪些改变?
3.Structured Streaming APIs是什么?


Spark2.0 SQL中的Time Window实例
http://www.aboutyun.com/thread-19171-1-1.html
1.Spark SQL中的window API是哪个版本引入的?
2.本文通过什么例子解释了Window API的使用?



资源:


dubbo视频系列之四相关文档及所用资源【限时分享】
http://www.aboutyun.com/thread-19172-1-1.html

RDD(弹性分布式数据集)-内存集群计算容错抽象【英文】
http://www.aboutyun.com/thread-19173-1-1.html

问答:

keystone与barbican联调问题
http://www.aboutyun.com/thread-19168-1-1.html

flume收集,gzip压缩损坏
http://www.aboutyun.com/thread-19169-1-1.html

openstack创建了ubuntu及其他系统的实例,都无法成功i安装
http://www.aboutyun.com/thread-19174-1-1.html

无法创建网络,大神们帮忙看看啊
http://www.aboutyun.com/thread-19175-1-1.html

关于大数据技术选型的困惑
http://www.aboutyun.com/thread-19176-1-1.html



about云2016年07月13日每日一读

【Lucene】Apache Lucene全文检索引擎架构之入门实战
http://www.aboutyun.com/thread-19160-1-1.html
1、Lucene中的全文搜索原理是什么?
2、如何使用Lucene处理问题?


轻松理解隐马尔可夫模型(HMM)
http://www.aboutyun.com/thread-19161-1-1.html
1、什么是熵(Entropy)?
2、如何理解最大熵模型?
3、如何理解隐马尔可夫模型(HMM)?



资源:

dubbo视频系列之三高可用架构篇【限时分享】
http://www.aboutyun.com/thread-19165-1-1.html

使用spark监控电子交易环境【英文】
http://www.aboutyun.com/thread-19166-1-1.html


问答:

linux全文复制
http://www.aboutyun.com/thread-19159-1-1.html

neutron外部网络down
http://www.aboutyun.com/thread-19162-1-1.html

CM 安装的oozie调用hive任务报找不到数据库
http://www.aboutyun.com/thread-19163-1-1.html

关于provider network的含义
http://www.aboutyun.com/thread-19164-1-1.html




about云2016年07月12日每日一读


算法入门-算法和菜谱之间的联系
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19152
1.算法和菜谱有什么共同点?
2.本文认为什么是算法?
3.算法有哪两个必要条件?
4.算法有哪两大支柱?



学会如何学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19153




资源:

dubbo视频系列之二入门高级篇【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19154


大型集群上的快速和通用数据处理架构(修正版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19155


问答:

详解MapReduce中shuffle过程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19149


Hbase启动报错,只有Hquorumpeer起来的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19150





about云2016年07月11日每日一读

推荐系统:个性化推荐-协同过滤
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19128
1. 什么是协同过滤?
2. UserCF主要思想是什么?
3. 用户相似度的度量方法有哪些?
4. UserCF存在的问题有哪些?如何改进?
5. ItemCF的主要思想是什么?
6. ItemCF如何实现?
7. ItemCF如何进行改进?
8. UserCF和ItemCF的相比较各自的特点是什么?

机器学习教程 十一-用scikit-learn做聚类分析大数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19129
1.监督学习方法你认为会有哪些?
2.什么是K-means聚类算法?


大数据成熟度模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19135



1.什么是大数据成熟度模型?
2.大数据成熟度模型有哪几个框架?
3.大数据如何助力于业务价值创造?

Solr特性总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19136
1.什么是Solr?
2.Solr有哪些特性?

Redis Cluster分区实现原理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19142
1.数据是如何被自动分散到不同的节点的?
2.客户端是如何能够正确找到节点的?
3.键空间迁移过程是怎么样的?

企业数据分析的架构和方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19143
1.怎么做企业数据分析?
2.有哪些数据分析方法?
3.数据处理流程有哪些?

Hadoop学习之环境搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19141

hadoop学习之hdfs
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19138

Hadoop学习之mapreduce及示例代码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19140

资源:
经典算法大全
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19145

老外视频教程:SQL on Hadoop - 使用hive分析大数据汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19147

dubbo视频系列之一入门基础篇【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19146

Neutron理解(一)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19125

Neutron理解(二)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19126

问答:
VM平台虚机迁移至OPenstack平台,怎么搞?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19127

怎么计算或确定运行一个第三方模型(可以理解为MR)所用到的资源(数据量已确定)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19130

关于kylin构建cube中step2时报connection exception异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19131

yum 安装了ceph 为什么 /etc/init.d/ceph 会报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19132

独立集群?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19133

关于hmaster和jobtracker的节点选择
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19134

spark on yarn 运行问题,一直循环
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19139



about云2016年07月08日每日一读

机器学习教程十-用scikit-learn的网格搜索快速找到最优模型参数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19120
1.什么是网格搜索?
2.网格搜索本文举了什么例子?

机器学习算法入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19121
1.什么是程序?
2.什么是算法?
3.什么是机器学习算法?
4.机器学习的主要任务是什么?
5.机器学习+数据库=?
6.什么是自然语言处理?





资源:

OpenStack实战指南(全)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19117


智慧城市中的大数据-李德仁
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19122



问答:

mapreduce报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19114


CDH agen节点会自动挂载一个目录,这是做什么的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19115


Hadoop-2.7.2集群安装后命令行报错 Couldn't create proxy provider null
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19116


求助Vxlan下,Bridge br-int  的隧道端点问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19118


ceph中怎么删除pool
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19119


MapReduce基础知识总结1  思维导图版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19123






about云2016年07月07日每日一读

机器学习教程 九-二元分类效果的评估方法
http://www.aboutyun.com/thread-19107-1-1.html
1.如何评估真阳性?
2.如何评估真阴性?
3.如何评估假阳性?
4.如何评估假阴性?
5.如何评估准确率?
6.如何评估精确率?
7.如何评估召回率?
8.如何评估召回率?
9.如何评估误警率?
10.如何评估ROC?
11.如何评价AUC?



机器学习助力神经科学的高维数据分析,两者如何相互激励与促进
http://www.aboutyun.com/thread-19108-1-1.html
1.如何进行高维数据分类?
2.什么是机器学习?
3.什么是基于模型的分析和无监督机器学习?
4.机器学习分类器有多好?
5.为什么是用于联接组学的机器学习?
6.什么是对标签的需求——人vs.机器?
7.什么是前馈 vs 递归( Recurrent )神经网络架构?
8.如何发现大脑分类技巧的策略?




资源:

看看老外视频教程系列5:SQL on Hadoop - 使用hive分析大数据-存储与生态系统
http://www.aboutyun.com/thread-19111-1-1.html

实现近实时健康数据中心数据分析使用模型驱动编程在Spark-Streaming和GraphX
http://www.aboutyun.com/thread-19112-1-1.html


问答:

大数据找工作
http://www.aboutyun.com/thread-19101-1-1.html

各位大神请教一个solr的问题
http://www.aboutyun.com/thread-19102-1-1.html


cm能管理使用tar包安装的服务吗
http://www.aboutyun.com/thread-19103-1-1.html

CM安装时的JDK选择问题
http://www.aboutyun.com/thread-19106-1-1.html

openstack neutron创建网络后外部网络网关接口down
http://www.aboutyun.com/thread-19109-1-1.html

到底是哪超时了
http://www.aboutyun.com/thread-19110-1-1.html




about云2016年07月06日每日一读

如何用深度学习识别网络欺诈?
http://www.aboutyun.com/thread-19094-1-1.html
1、当前欺诈广告是什么现状?
2、什么是深度学习?
3、如何用卷积类神经网络算法构建系统?



机器学习教程 八-用scikit-learn做特征提取
http://www.aboutyun.com/thread-19095-1-1.html
1、sk-learn分类变量的特征提取如何实现?
2、如何实现文字特征提取?
3、如何对矩阵做标准化?



资源:

Spinach-构建于Spark之上的即席查询引擎
http://www.aboutyun.com/thread-19097-1-1.html

看看老外视频教程系列4:SQL on Hadoop - 使用hive分析大数据-高级HiveSQL
http://www.aboutyun.com/thread-19096-1-1.html

问答:

hive执行drop table的命令时,会擦死!各位大神帮忙看看
http://www.aboutyun.com/thread-19091-1-1.html

storm-kafka整合问题
http://www.aboutyun.com/thread-19092-1-1.html

hive权限控制无效问题
http://www.aboutyun.com/thread-19093-1-1.html

给solr添加数据总是报错,
http://www.aboutyun.com/thread-19099-1-1.html




about云2016年07月05日每日一读

OpenStack云端的资源调度和优化剖析
http://www.aboutyun.com/thread-19085-1-1.html
1.OpenStack如何资源调度?
2.PRS是什么?
3.OpenStack调度如何优化?


机器学习教程 七-用随机梯度下降法(SGD)做线性拟合
http://www.aboutyun.com/thread-19086-1-1.html
1.什么是梯度下降法?
2.利用Python如何实验?
3. 如何进行优化?




MapReduce实现多矩阵乘法计算,Map准备数据,Reduce无法实现分布式计算问题
http://www.aboutyun.com/thread-19079-1-1.html


贵州数据宝:做大数据行业的“淘宝”
http://www.aboutyun.com/thread-19082-1-1.html

非常的好的协同过滤入门文章
http://www.aboutyun.com/thread-19081-1-1.html

资源:

看看老外视频教程系列3:SQL on Hadoop - 使用hive分析大数据-hive查询语言
http://www.aboutyun.com/thread-19088-1-1.html

计算机的心智操作系统之哲学原理
http://www.aboutyun.com/thread-19090-1-1.html

问答:

Sqoop export 多map情况下数据库事务死锁问题
http://www.aboutyun.com/thread-19083-1-1.html

oozie调用hive过程中报错
http://www.aboutyun.com/thread-19084-1-1.html

大神们  说说ceph安装报错这是怎么回事
http://www.aboutyun.com/thread-19087-1-1.html



about云2016年07月04日每日一读

美团Spark性能优化指南——基础篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19058
1. Spark开发调优常见的有哪几个原则?如何使用?
2. Spark作业运行的基本原理是什么?
3. Spark资源调优可以有哪些参数?


机器学习教程 五-用matplotlib绘制精美的图表
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19060
1.怎么样安装matlab?
2.怎么样用matlab绘制图像?

教你如何用R进行数据挖掘(一)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19063
1.为什么学习R语言?
2.怎么样用R语言进行计算?


教你如何用R进行数据挖掘(二)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19064
1.怎么用R进行数据处理?
2.怎么用R进行建模?

网络爬虫项目介绍及简单例子
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19067

朴素贝叶斯之MapReduce版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19070
1.怎样计算类别的先验概率?
2.怎样计算每个词的条件概率?
3.什么是假设二分类问题?

Google深度学习笔记 循环神经网络实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19069

1.怎样构建计算单元?
2.什么是CBOW?
3.怎样优化lstm?

HBase最佳实践-列族设计优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19072
1.BLOCKSIZE属性在不同场景下应该如何设置?
2.COMPRESSION属性和DATA_BLOCK_ENCODING属性的区别是什么?
3.Hbase需要注意哪些设计原则?


机器学习教程 六-用scikit-learn求解多项式回归问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19073
1.怎样利用scikit-learn解决多项式回归问题?
2.python怎样做线性回归?
3.python怎样做多项式回归?

资源:
看看老外视频教程系列2:SQL on Hadoop - 使用hive分析大数据-hive入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19074

广义线性模型在spark MLlib和SparkR
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19075

问答:
求一spark mllib视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19061

Hbase集群scan命令rowkey检索问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19062

spark默认分区
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19065

新手请教集群的角色分配问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19066

创建实例求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19071




about云2016年07月01日每日一读

深度学习与自然语言处理(4)_斯坦福cs224d 大作业测验1与解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19041
1.什么是Softmax ?
2.神经网络怎样学习?
3.什么是word2vec?
4.如何进行情感分析?




机器学习教程 四-用scikit-learn求解多元线性回归问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19042
1.多元线性回归模型是什么?
2.如何用使用scikit-learn求解多元线性回归?




redis应用之本机搭建redis集群具体实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19043


资源:

使用不同的功能构建推荐【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19055


看看老外视频教程系列1:SQL on Hadoop - 使用hive分析大数据-hadoop入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19056




问答:

感觉hadoop基本没有用户认证体系
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19044


sqoop 将oracle数据导入hive报错,报错信息如下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19047


基于Hadoop的日志分析Demo
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19048


CDH 配置文件以我代码文件夹下的为准还是以管理界面为准
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19050

关于hdfs和本地文件系统的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19051



Oozie启动过程没有出错,但是webUI界面报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19052


HDFS上存储的是GBK编码的文件,mapreduce可以使用gbk编码读取文件吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19054




about云2016年06月30日每日一读

使用深度学习实现智能聊天机器人
http://www.aboutyun.com/thread-19037-1-1.html
1.聊天机器人的类型本文分为了哪些类型?
2.聊天机器人的有几种主流技术?
3.如何利用深度学习构建聊天机器人?



顶尖程序员的5个特点
http://www.aboutyun.com/thread-19038-1-1.html


初学redis数据库笔记
http://www.aboutyun.com/thread-19029-1-1.html

资源:

spark:分析操作系统【about云】
http://www.aboutyun.com/thread-19030-1-1.html

从非结构化文本基于NLP使用spark提取关系【英文about云】
http://www.aboutyun.com/thread-19031-1-1.html

问答:

openstack云主机ping不通物理机
http://www.aboutyun.com/thread-19027-1-1.html

新人初学,有没有一起交流的群或者朋友一起探讨
http://www.aboutyun.com/thread-19032-1-1.html

hbase如何分页(比如跳到某一页)
http://www.aboutyun.com/thread-19033-1-1.html

hbase shell中scan命令的formatter不起作用是怎么回事?
http://www.aboutyun.com/thread-19035-1-1.html

hiveserver2启动失败
http://www.aboutyun.com/thread-19036-1-1.html

请教一个clouder manage 集群调优的问题
http://www.aboutyun.com/thread-19039-1-1.html




about云2016年06月29日每日一读

深度学习与自然语言处理(3)_斯坦福cs224d Lecture 3
http://www.aboutyun.com/thread-19018-1-1.html
1、如何理解神经网络?
2、什么是正向计算,反向传播?
3、如何理解梯度检验、参数的哈维初始化和学习速率?



机器学习教程 三-用scikit-learn求解一元线性回归问题
http://www.aboutyun.com/thread-19020-1-1.html
1、scikit-learn如何实现一元线性回归模型?
2、如何使用matplotlib画一元线性图像?
3、如何进行模型评估?



资源:
使用spark sql旋转【行列转换】数据
http://www.aboutyun.com/thread-19024-1-1.html

Reactive Feature Generation使用Spark和MLlib
http://www.aboutyun.com/thread-19025-1-1.html


问答:


请教一些大数据业务处理场景解决方案
http://www.aboutyun.com/thread-19015-1-1.html

HDFS文件上传加速问题
http://www.aboutyun.com/thread-19016-1-1.html

sentry oozie的配置问题
http://www.aboutyun.com/thread-19017-1-1.html

集群删除节点问题
http://www.aboutyun.com/thread-19019-1-1.html

使用mapReduce分析HDFS中大文件只起一个map的问题?
http://www.aboutyun.com/thread-19021-1-1.html

双击eclipse显示没有虚拟机
http://www.aboutyun.com/thread-19023-1-1.html




about云2016年06月28日每日一读

深度学习在自然语言处理上的应用(2)_斯坦福cs224d Lecture 2
http://www.aboutyun.com/thread-19005-1-1.html

1.如何词向量评价?
2. 对外在性任务如何进行训练?
3.什么是词窗分类?


机器学习教程 二-安装octave绘制3D函数图像
http://www.aboutyun.com/thread-19006-1-1.html
1.mac系统如何安装?
2.centos7系统如何安装?
3.效果图如何?


联想企业网盘:SaaS服务集群化持续交付实践
http://www.aboutyun.com/thread-19008-1-1.html

资源:

spark学习深递归神经网络【about云】
http://www.aboutyun.com/thread-19010-1-1.html

spark sql优化器的改进【about云】
http://www.aboutyun.com/thread-19011-1-1.html

问答:

请教大家一个关于spout failed的问题解决方案
http://www.aboutyun.com/thread-19003-1-1.html

CDH集群突然变慢,ParcelUpdateService报错,求指点
http://www.aboutyun.com/thread-19007-1-1.html

storm startOffsetTime的问题
http://www.aboutyun.com/thread-19009-1-1.html

怎么修改cdh默认配置的默认值
http://www.aboutyun.com/thread-19012-1-1.html

flume java.lang.NoClassDefFoundError: org/apache/hadoop/io/SequenceFile$Compr...
http://www.aboutyun.com/thread-19013-1-1.html




about云2016年06月27日每日一读
用Akka解决Spark+ElasticSearch实时计算平台的瓶颈
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18982
1.Spark和ElasticSearch怎么解决实时计算瓶颈?
2.Akka和ElasticSearch怎么解决实时计算瓶颈?

Spark Streaming性能优化系列-如何获得和持续使用足够的集群计算资源?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18984
1.数据峰值有什么影响?
2.如何限制Spark的接收速度?


Spark python开发---Spark处理后的数据可视化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18992
1.怎样进行数据可视化的预处理?
2.怎样创建wordcloud?
3.怎样进行tweets定位并在地图上显示?

深度学习与自然语言处理(1)_斯坦福cs224d Lecture 1
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18996
1.什么是自然语言处理?
2.什么是词向量?
3.有哪些分词模型?

机器学习教程 一-不懂这些线性代数知识 别说你是搞机器学习的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18997
1.机器学习需要掌握哪些线性代数知识?
2.什么是矩阵?
3.什么是奇异值分解?

资源:
大数据结构中如何使用spark属性2016
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18999

构建实时数据仓库【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19000

问题:
hdfs出现了Datanode Volume Failures怎么处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18972

awk实现简单日志分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18973

Linux简单笔记
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18974

storm数据重复消费
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18975

Linux常用命令大全
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18976

spark jobhistory 查看问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18977

kvm创建win7和2008虚拟机失败问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18978

spout 的Acked为何还比Emitted大?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18979

Hadoop 历史
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18980
Spark历史
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18981

idea通过jdbc连接hive一直报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18983

求助,关于mapreduce的map输入类型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18985

好书就要分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18986

求助:安装hive报这个错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18988

hue新建用户无法访问hive
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18989

mitaka版本安装Win7找不到硬盘驱动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18990

sqoop  mapreduce job卡着
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18991

关于spark监护的rest api访问报错问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18995

scala8进行编译报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18998



about云2016年06月24日每日一读

MapReduce 进阶:Partitioner 组件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18959
1. Hadoop默认的HashPartitioner是如何进行分区的?
2. 如何自定义HashPartitioner?
3. 如何自定义Partitioner?
4. 其他的Partitioner有哪些?


Hadoop源码分析1——数据节点写数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18966
1.客户端写文件时系统各节点是如何配合的?
2.你认为DistributedFileSystem的作用是什么?
3.写数据包括哪些字段?



Hadoop源码分析——数据节点写数据2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18967



资源:

机器学习的一本书
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18954


hadoop实战系列7:流量项目背景简介及行为轨迹增强模块等视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18969


spark2.0文档【2016英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18970


问答:

linux环境变量问题 无法登陆
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18955


hadoop使用交换内存的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18957


hive中各个队列属性设置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18960


eclipse 安装hadoop 插件出的问题 求帮助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18962


openstack-kilo-neutron-agent服务实际是active的-但是显示为XXX
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18963


求助,Hadoop执行打包好的jar程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18964


Hadoop执行打包好的jar程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18965


开始跑后20秒内,其中一台SLAVE会SSH断线,DataNode与TaskTracker挂掉
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18968

openstack如何制作操作系统镜像?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18961




about云2016年06月23日每日一读

李开复万字长文科普人工智能:AI是什么 如何改变当今世界?
http://www.aboutyun.com/thread-18948-1-1.html
1.人工智能是一种怎样的工具?
2.何为人工智能?
3.如何进行科普深度学习?
4.什么是深度学习的应用领域?
5.为什么人工智能将重塑亿万级别的领域?
6.Google的野心是什么?
7.何为深度学习的挑战?
8.人工智能如何快速商业化?
9.人工智能的未来蓝图是什么样的?



2016 Spark旧金山峰会-Spark 2.0成为焦点及对未来技术展望
http://www.aboutyun.com/thread-18949-1-1.html
1.Spark 2.0是什么样的?
2.Structured API是什么?
3.Structured Streaming怎样工作?
4.机器学习与数据科学是什么?
5.Spark&深度学习怎样?
6.机器学习如何?
7.怎样展望未来?


函数式思维和函数式编程
http://www.aboutyun.com/thread-18950-1-1.html
1.本文是如何理解函数式编程的?
2.如何用函数式的方式思考、函数式的方式编程实现?



资源:

hadoop实战系列6:hive及hbase入门相关视频
http://www.aboutyun.com/thread-18951-1-1.html

sparkling water介绍【英文】
http://www.aboutyun.com/thread-18952-1-1.html

问答:

机器学习,各位是怎么学的?
http://www.aboutyun.com/thread-18942-1-1.html

hdfs数据移动问题
http://www.aboutyun.com/thread-18943-1-1.html

mapreduce map task并发性问题
http://www.aboutyun.com/thread-18945-1-1.html

hql中的数据类型转换
http://www.aboutyun.com/thread-18946-1-1.html

flume syslog to hdfs 如何给信息添加时间
http://www.aboutyun.com/thread-18947-1-1.html



about云2016年06月22日每日一读

使用HMM【隐马尔科夫模型】实现简单拼音输入法
http://www.aboutyun.com/thread-18929-1-1.html
1、什么是隐马尔科夫模型?
2、如何通过拼音推测汉字?
3、如何理解前向概率Viterbi算法?



HBase最佳实践网易视频云--内存规划
http://www.aboutyun.com/thread-18932-1-1.html
1.本文hbase是如何规划内存的?
2.写多读少型 + LRUBlockCache 内存规划思路是什么?
3.读多写少型 + BucketCache 内存你认为内存该如何规划?



Kafka设计解析(五)- Kafka性能测试方法及Benchmark报告
http://www.aboutyun.com/thread-18930-1-1.html
1、如何利用自带的性能测试脚本测试Kafka的性能?
2、如何通过Kafka Manager查看整个集群的Metrics?
3、如何使用Kafka Manager监控Kafka的工作状态?



hadoop使用小技巧
http://www.aboutyun.com/thread-18934-1-1.html

资源:

hadoop实战系列5:hadoop HA原理、部署及相关zookeeper
http://www.aboutyun.com/thread-18938-1-1.html

spark配置-企业系统管理员【英文资料】
http://www.aboutyun.com/thread-18939-1-1.html

问答:

Ignite as Secondary File System 启动出错
http://www.aboutyun.com/thread-18931-1-1.html

计算节点单独安装在物理服务器无法SSH实例
http://www.aboutyun.com/thread-18933-1-1.html

gitreview ssh 失败
http://www.aboutyun.com/thread-18935-1-1.html

hbase 写数据进不去
http://www.aboutyun.com/thread-18936-1-1.html

请教hbase等待线程数过多问题?
http://www.aboutyun.com/thread-18937-1-1.html



about云2016年06月21日每日一读

别因为要学的太多反而压垮自己
http://www.aboutyun.com/thread-18919-1-1.html
1.不要学习的太多?
2.什么是及时的学习?
3.你不可能什么都知道吧?


Kafka设计解析(四)- Kafka Consumer设计解析
http://www.aboutyun.com/thread-18921-1-1.html
1.什么是High Level Consumer?
2.如何使High Level Consumer Rebalance?
3.如何观察Consumer状态机?



资源:

刘永平-Spark-streaming在京东的项目实践
http://www.aboutyun.com/thread-18924-1-1.html

hadoop实战系列4:自定义bean及hadoop序列化接口等自定义
http://www.aboutyun.com/thread-18926-1-1.html

问答:

如何获取spark streaming正在运行的 Application
http://www.aboutyun.com/thread-18911-1-1.html

感觉apache ambri 没有cloudera management火
http://www.aboutyun.com/thread-18912-1-1.html

怎样修改Cloudera hadoop里面的默认配置
http://www.aboutyun.com/thread-18914-1-1.html

求助 hive 分区表导出
http://www.aboutyun.com/thread-18915-1-1.html

使用apache的顶级项目之一的zeppelin出现的问题
http://www.aboutyun.com/thread-18916-1-1.html

请教各位大牛,创建实例(实例处于错误状态)IP可以获得
http://www.aboutyun.com/thread-18917-1-1.html

openstack-kilo-neutron-创建网络后无法ping通router网关
http://www.aboutyun.com/thread-18918-1-1.html

cloudera manager 如何修改配置文件
http://www.aboutyun.com/thread-18920-1-1.html

Hadoop搭建集群时相关问题
http://www.aboutyun.com/thread-18922-1-1.html

在openstack使用云主机的时候会被要求操作系统重置密码,这应该怎么做
http://www.aboutyun.com/thread-18923-1-1.html

各位大神请教一个存储hbase出现的问题
http://www.aboutyun.com/thread-18927-1-1.html



about云2016年06月20日每日一读

Kafka设计解析(一)- Kafka背景及架构介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18894
1.kafka有什么作用?
2.常用的消息队列有哪些?
3.Kafka的设计理念是什么?


Kafka设计解析(二)- Kafka HA高可用(上)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18903
1.Kafka为何需要High Available?
2.Kafka为何需要Replication?
3.如何将所有Replica均匀分布到整个集群?

Kafka设计解析(三)- Kafka HA高可用(下)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18904
1.如何创建/删除Topic?
2.Broker响应请求包含哪些流程?
3.LeaderAndIsrRequest是如何响应的?

HBase性能优化方法总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18909

1.HBase有哪几种性能优化方法?
2.HBase怎样做到高并发、批量读写?
3.怎样优化Rowkey?

我是如何面试的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18893
1.简历造假严重吗?
2.面试会问什么问题?
3.怎么样提高自己面试的成功率?

Hive的HQL语句及数据倾斜解决方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18889

1. Hive如何创建内部表和外部表?
2. Hive如何进行分区?
3. Hive常用的基本操作有哪些?
4. Hive如何自定义函数?
5. Hive中常见的数据倾斜有哪些?如何解决?

大数据统计:怎样的程序员最抢手?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18899

1.怎样的程序员最抢手?
2.互联网公司怎样吸引优秀程序员加盟?
3.程序员应该怎样跳槽?


中文分词原理和实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18901

1.有哪些主流分词方法?
2.什么是基于规则或词典的方法的分词方法?
3.什么是基于统计的分词?


怎样成为你圈子中最牛逼的那种人?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18907

1.如何才能脱颖而出?
2.如何快速提升自己,而不使自己的梦想被社会和现实所打碎?
3.如何实现巨大的飞越使自己能够跨过同一岗位上疯狂的竞争?

资源:

hadoop实战系列3:hdfs源码跟踪及job提交源码跟踪等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18905

加速企业spark【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18906

问答:
协处理器能不能跨region做逻辑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18888

spark Streaming 有几种运行方式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18890

spark Streaming 有几种运行方式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18890

openstack_auth 中要求session中存放token对象, 这种情况下如何进行跨域共享session?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18891

hdfs如何实现datanode和disk之间数据传输,
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18895

openstack 使用nova命令报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18896

请教各位大牛创建实例 (HTTP 500)错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18897

kudu cloudera怎么样?有人有使用经验吗
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18898

IDEA中本地运行spark程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18908


about云2016年06月16日每日一读

Spark python 开发者 ---Spark流式数据处理
http://www.aboutyun.com/thread-18866-1-1.html
1.Spark Streaming在数据密集型应用中的位置在哪?
2.Spark Streaming 内部工作方式是什么样的?
3.Spark Streaming 的底层基础怎么实现?
4.如何构建容错系统?
5.怎样以TCP sockets处理实时数据?
6.如何实时控制Twitter数据 ?
7.如何实时处理Tweets?
8.怎样构建一个稳定缩放的流式应用?
9.如何搭建 Kafka?
10.怎么开发 producers?
11.如何开发 consumers?
12.如何在Kafka 上开发Spark Streaming consumer?
13.如何探索flume?
14.基于Flume, Kafka和Spark开发数据流水线是什么样的?


大数据系统数据采集产品的架构总结与介绍、分析
http://www.aboutyun.com/thread-18869-1-1.html
1.什么是Apache Flume?
2.什么是Fluentd?
3.什么是Logstash?
4.什么是Scribe?
5.什么是Chukwa?
6.什么是Splunk Forwarder?


资源:

spark编程
http://www.aboutyun.com/thread-18859-1-1.html

hadoop实战系列1:hadoop入门及hadoop岗位要求等
http://www.aboutyun.com/thread-18873-1-1.html

OpenStack-Mirantis-8.0-版本发布说明
http://www.aboutyun.com/thread-18875-1-1.html

问答:

hadoop : Permission denied by sticky bit setting
http://www.aboutyun.com/thread-18860-1-1.html

spark分布式处理同一个文件的问题
http://www.aboutyun.com/thread-18861-1-1.html

hive 调hadoop job 挂掉,帮忙看下
http://www.aboutyun.com/thread-18863-1-1.html

hadoop集群监控工具有哪些,推荐一下
http://www.aboutyun.com/thread-18864-1-1.html

同过CM web界面删除节点后nodemanager无法启动
http://www.aboutyun.com/thread-18865-1-1.html

map reduce卡住
http://www.aboutyun.com/thread-18868-1-1.html

openstack中的metadata疑问
http://www.aboutyun.com/thread-18870-1-1.html



about云2016年06月15日每日一读

使用混淆矩阵对分类模型进行评估-Confusion matrix
http://www.aboutyun.com/thread-18847-1-1.html
1、什么是混淆矩阵(Confusion matrix)模型?
2、如何使用混淆矩阵进行实例分析?
3、如何使用混淆矩阵对预测的结果进行评估?



Mirantis OpenStack 8.0 版本大概性分析
http://www.aboutyun.com/thread-18849-1-1.html
1、Mirantis OpenStack 8.0有哪些组件?
2、MOS 8.0新增哪些特性?
3、裸机服务管理和Murano+ Kubernetes+ GCE支持混合云如何使用?



sparkSQL 问题
http://www.aboutyun.com/thread-18846-1-1.html

网站编辑功能
http://www.aboutyun.com/thread-18850-1-1.html

资源:

淘宝云梯分布式计算平台整体架构
http://www.aboutyun.com/thread-18854-1-1.html

Spark源码解读迷你【书籍推荐】
http://www.aboutyun.com/thread-18855-1-1.html

问答:

MR程序在eclipse就能跑,打成jar包放到外名就不能跑,求救
http://www.aboutyun.com/thread-18845-1-1.html

求CDH maven pom,官网的只有列表,需要一个个手动添加
http://www.aboutyun.com/thread-18848-1-1.html


自己总结的mapreduce Shuffle流程图
http://www.aboutyun.com/thread-18852-1-1.html

shuffle流程图
http://www.aboutyun.com/thread-18853-1-1.html

常见的资源有没有百度盘下载的
http://www.aboutyun.com/thread-18856-1-1.html




about云2016年06月14日每日一读

Spark:value registerTempTable is not a member of org.apache.spark.rdd.RDD解决
http://www.aboutyun.com/thread-18823-1-1.html
1.如何将标准的RDD(org.apache.spark.rdd.RDD)转换成SchemaRDD?
2.什么是SchemaRDD?


数据分析之共同好友统计
http://www.aboutyun.com/thread-18826-1-1.html
1.如何统计好友?
2.如何用代码实现?
3.用到的算法是什么?


Kafka Streams入门指南
http://www.aboutyun.com/thread-18827-1-1.html
1.什么是Kafka Streams?
2.有哪些核心概念?
3.参数如何配置?



hadoop伪分布式安装
http://www.aboutyun.com/thread-18835-1-1.html

资源:
hadoop2.6+zookeeper-3.4.6+hbase-1.0.3+hive1.2.1环境搭建
http://www.aboutyun.com/thread-18824-1-1.html

hive编程入门课程——少杰
http://www.aboutyun.com/thread-18839-1-1.html

hive随谈之hive入门
http://www.aboutyun.com/thread-18840-1-1.html

问答:
sparkSQL问题
http://www.aboutyun.com/thread-18822-1-1.html

hive加载hbase表出错
http://www.aboutyun.com/thread-18832-1-1.html

swift存储问题
http://www.aboutyun.com/thread-18836-1-1.html

spark sql 最简单的例子一直运行不成功
http://www.aboutyun.com/thread-18837-1-1.html

求解 namenode启动失败
http://www.aboutyun.com/thread-18838-1-1.html

Eclipse向Spark集群提交任务时找不到主类
http://www.aboutyun.com/thread-18841-1-1.html

openstack访问keystone获得的token是保存在哪里的?
http://www.aboutyun.com/thread-18842-1-1.html

求Intellij idea开发spark应用程序完全教程
http://www.aboutyun.com/thread-18843-1-1.html



about云2016年06月13日每日一读


Kylin环境搭建和操作
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18809


1.什么是Kylin?
2.怎样搭建Kylin环境?
3.Kylin工作原理是什么?


支持关系型数据库及NoSQL的统一数据建模方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18811
1.什么是Unified Modelset?
2.Unified Modelset中怎样查询?
3.Unified Modelset中怎样统一链接数据库?


分享:
spark on yarn UI界面问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18800



资源:

IBM-bigtable系统和结构【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18817


基于hadoop的统一数据存储和分析平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18818



问答:

请问kylin如何做增量cube?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18802


该运行状况测试不良,因为 Service Monitor 未找到活动 XXX
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18812


【求助】cloudera-scm-server启动后就吊死
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18813


Kylin Cube 创建教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18803


spark运行不报错,但是没有正确结果出现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18804


求助 flume + kafka  异常 java.nio.BufferUnderflowException
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18805


新手提问,swift可以单独安装不?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18806





about云2016年06月12日每日一读

Kafka - SQL 引擎分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18793
1.在Kafka中使用SQL的流程是什么?
2.怎样配置Kafka,使得在Kafka中使用SQL?
3.在Kafka中使用SQL有哪些注意事项?




入职阿里巴巴数据分析师——我的10个关键转折点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18794
1.怎样成为一名数据分析师?
2.怎样做好定位?
3.怎样调整学习方向?



Spark 2.0中Dataset介绍和使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18780
1.什么是dataset?
2.本文认为DataSet和RDD主要的区别是是什么?
3.Dataset Wordcount实例本文用了几步?




绝不能错过的10款最新OpenStack网络运维&监控工具
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18782
1. TAAS 的用途是什么?
2. Skydive的用途是什么?
3. DSCP是什么?如何在OpenStack中使用?
4. 如何实现对OpenStack网络Trouble shoot?
5. LBaaS是什么?
6. OVS是什么?
7. DNS如何设设置?

8. DVR 场景下 SNAT Router 的高可用功能如何实现?
9. 没有 DVR 时TWC 公司是怎么设计 OpenStack 架构的?


大数据对统计思维的影响
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18787
1.统计思维本文认为发生了哪些变化?
2.数据分析思维的变化本文强调了哪三点?
3.面对大数据,需要考虑哪些内容?



R与Hadoop结合实现的三种方式介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18788
1.如何实现R与Hadoop联合作业?
2.你认为有几种方法实现R与Hadoop结合?
3.本文介绍了哪三种方式?



资源:

IDEA 及其插件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18783




问答:
解决'Error contacting service. It is probably not running.'问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18791


启动hadoop后,fs.defaultFS中配置的9000端口没有出现在监听中?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18792


linux sftp修改配置文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18773

apache hadoop2.7.1源码编译报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18779


从一个简单例子分析stage划分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18776



spark on yarn 客户端WEB UI界面打不开
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18790


求救:如何离线安装hue啊
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18781


mapreduce 分区输出多个文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18784


spark on yarn 配置和运行方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18785


spark on yarn 提交到集群运行报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18786


hdfs-site.xml中的dfs.namenode.rpc-address可以不配置吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18789


hadoop集群安装:是不是安装配置好namenode后,把整个安装目录分发到各datanode上?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18795







about云2016年06月09日每日一读
得到老板赏识的5条建议
http://www.aboutyun.com/thread-18765-1-1.html
1. 你主动性强吗?
2. 你是否考虑过产品这样做是否合理?
3. 你把产品当成自己的产品了吗?
4. 你把公司和你捆绑在一起了吗?
5. 你反省过自己吗?



从Storm到Heron,Twitter的实时计算框架有哪些重大进化?
http://www.aboutyun.com/thread-18770-1-1.html
1.Twitter 为什么选择 real time 模式?
2.Twitter Storm 是什么?
3.Why Heron?
4.Heron in practice 是什么样?
5.Heron Performance 怎么样?
6.关于Heron 有哪些常问Q&A对话?




资源:

spark参考书
http://www.aboutyun.com/thread-18760-1-1.html

Linux_Kernel核心中文手册(内核图解)
http://www.aboutyun.com/thread-18771-1-1.html

问答:

求助 hdfs查询目录下文件数量 包括子目录文件数量
http://www.aboutyun.com/thread-18759-1-1.html

spark集群Java生成libsvm模型的效率问题
http://www.aboutyun.com/thread-18761-1-1.html

有配置federation吗总说Unable to determine the nameservice
http://www.aboutyun.com/thread-18762-1-1.html

从mysql导入到hive后,看不到hive表数据
http://www.aboutyun.com/thread-18763-1-1.html

HBASE 组授权,无法使用
http://www.aboutyun.com/thread-18764-1-1.html

无法用sqoop把hive导到mysql
http://www.aboutyun.com/thread-18766-1-1.html

storm读取kafka中新消息SpoutConfig.forceFromStart 找不到
http://www.aboutyun.com/thread-18767-1-1.html

请教如何将其他虚拟机创建的映像加加入到openstack进行管理
http://www.aboutyun.com/thread-18769-1-1.html



about云2016年06月08日每日一读

Spark(1.6.1) Sql 编程指南+实战案例分析
http://www.aboutyun.com/thread-18753-1-1.html
1、Spark SQL操作流程有哪些?
2、如何加载/保存数据源?
3、保存模式有哪些?



基于HBase的冠字号查询系统2--实现部分
http://www.aboutyun.com/thread-18752-1-1.html
1、冠字号查询系统功能包括哪些内容?
2、取款流程和存款流程代码如何实现?



资源:

scala编程
http://www.aboutyun.com/thread-18745-1-1.html

Spark Streaming使用和概要图:时金魁  
http://www.aboutyun.com/thread-18755-1-1.html

Spark2.0-陈超
http://www.aboutyun.com/thread-18756-1-1.html


问答:

openstack MQP server controller:5672 closed the connection. Check login crede...
http://www.aboutyun.com/thread-18748-1-1.html

PHP连接HIVE通过web页面图形化显示hive查询结果
http://www.aboutyun.com/thread-18744-1-1.html

scala程序报错bad symbolic reference to org.apache.hadoop.io encountered in cl...
http://www.aboutyun.com/thread-18743-1-1.html

谁在spark下调用过中科院的ICTCLAS50分词器
http://www.aboutyun.com/thread-18750-1-1.html

liberity的云主机控制台日志没有,创建后脚本执行不了
http://www.aboutyun.com/thread-18749-1-1.html

HDFS那个HA不错,但如果坏了一个,怎么重建?
http://www.aboutyun.com/thread-18754-1-1.html

spark运行中问题
http://www.aboutyun.com/thread-18757-1-1.html



about云2016年06月07日每日一读

高可用Hadoop平台-Oozie工作流
http://www.aboutyun.com/thread-18733-1-1.html
1.什么是Oozie?
2.Oozie Server的依赖有哪些?
3.如何配置Oozie?


什么是深度学习以及为什么你要了解它?
http://www.aboutyun.com/thread-18735-1-1.html
1.什么是深度学习?
2.与其它方法相比,有什么优点?
3.为什么要研究深度学习?



hadoop开发诚招大牛,坐标上海or北京,不能错过
http://www.aboutyun.com/thread-18740-1-1.html

资源:

Spark_Mllib_实践与优化_雷宗雄
http://www.aboutyun.com/thread-18739-1-1.html

并行发展的基础架构_Gator.pdf
http://www.aboutyun.com/thread-18741-1-1.html

问答:

求助,这个dataframe的scala代码怎么写
http://www.aboutyun.com/thread-18734-1-1.html

如果进行日志数据的字段分割
http://www.aboutyun.com/thread-18736-1-1.html



about云2016年06月06日每日一读


Spark Streaming优化介绍和应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18714
1.lambda架构原理是什么?
2.Hulu怎么进行数据收集?
3.怎么样监控数据?

基于Spark的风控系统架构实践和技术细节【京东】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18715
1.京东天网系统是做什么的?
2.天网系统主要有哪些模块?
3.天网系统怎么样对电子商务中的交易进行风险管控?


Spark Streaming怎样保证数据零丢失
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18719

1.spark streaming怎样做到可靠的sources和可靠的receivers?
2.数据可能的丢失场景有哪些?
3.什么是WAL?


基于HBase的钞票识别查询系统1--理论部分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18720

1.钞票识别查询系统的功能有哪些?
2.钞票识别查询系统的架构是怎样的?
3.怎样基于HBase进行钞票识别查询系统的数据库设计?

基于SSH的HDFS文件管理系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18726

1.怎样利用hdfs管理文件?
2.hdfs中怎样检索文件夹?
3.怎样读取序列文件?

六步让你从数据分析小白变成高手
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18727

1.数据分析的步骤是什么?
2.怎样进行数据治理?
3.怎样做指标分析?

资源:
张宁--移动大数据技术在互联网金融获客及经营中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18730

鲜活的数据:数据可视化指南[书籍]
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18729

问答:
neutron网络创建实例500错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18721

spark-shell报错Please check the values of 'yarn.scheduler.maximum-allocation-mb'
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18707

spark-submit运行程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18708

pip install Babel-2.1.1.tar.gz出现错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18709

hbase启动报错,求大神帮助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18710

ubuntu mysql用dump命令导出的数据库放在哪了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18711

hadoop HA双机可自动切换。但如果启动时只能启动一个咋办?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18712

如何访问需要kerberos认证的web
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18713

CDH能集成storm吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18716

nova --debug boot return http 500 error
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18717

【求助】CDH5.3中balancer报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18718

用过elasticsearch的来解答一下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18722

spark-shell中读取压缩文件报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18724

oozie启动失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18725



about云2016年06月03日每日一读

Hadoop 3.0做了哪些改变
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18701
1.hadoop3.0是基于jdk1.7还是1.8?
2.Hadoop 3.0有哪些新特性?
3.Hadoop 3.0YARN有哪些变化?



Apache Spark 2.0概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18702
1.spark ML持久性的关键特性包括哪些?
2.Apache Spark 2.0为何说为机器学习模型注入持久性?



资源:

淘宝海量数据产品技术
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18703


openstack所有命令
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18705



问答:

sqoop1居然安装后不好使了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18687


Hive无法执行语句
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18688


运行完spark-submit后,master进程自动结束了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18689


sqoop1安装后不读lib下的jar
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18690


编译spark后运行spark-shell和spark sql报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18691


您的Cloudera Enterprise Data Hub Edition试用版已过期(有影响吗?)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18692


Spark Streaming实时更新Mllib中的算法模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18694


关于hive thrift server的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18695


keystone-manage.py带来的问题,求解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18696


hive-hbase整合后 查全部能查 条件差报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18697


碰到scala的一个奇怪的问题,请大家帮忙看看
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18698


hadoop-2.2 + nutch-1.7报错贴上,请大神点拨
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18699


nova问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18704



about云2016年06月02日每日一读

搜索引擎索引的数据结构和算法
http://www.aboutyun.com/thread-18677-1-1.html
1.索引技术的基础是什么?
2.如何建立索引?
3.如何进行查询处理?
4.如何进行短语查询?


HBase 40道测试题【附答案】
http://www.aboutyun.com/thread-18678-1-1.html
1.基础能力都是什么?
2.HBase核心知识点有哪些?
3.HBase 高级应用有哪些重点?
4.HBase 安装、部署、启动如何考察?


spark安装总结
http://www.aboutyun.com/thread-18673-1-1.html

资源:

云计算在智能电网调度技术支持系统中的应用研究
http://www.aboutyun.com/thread-18684-1-1.html

云计算在供应链管理中的应用
http://www.aboutyun.com/thread-18685-1-1.html

问答:

storm拓扑运行时无法启动nimbus
http://www.aboutyun.com/thread-18672-1-1.html

spark on yarn mysql找不到驱动的错误
http://www.aboutyun.com/thread-18674-1-1.html

hiveserver启动后就一直停留在等待界面
http://www.aboutyun.com/thread-18675-1-1.html

大神们,解决下ceph和openstack整合的问题
http://www.aboutyun.com/thread-18676-1-1.html

sqoop 导入 hive 报错
http://www.aboutyun.com/thread-18679-1-1.html

spark集群环境运行报错
http://www.aboutyun.com/thread-18680-1-1.html

Hive的meta store 拒绝链接
http://www.aboutyun.com/thread-18681-1-1.html

网络节点neutron配置问题
http://www.aboutyun.com/thread-18682-1-1.html

Spark运行报check your cluster UI to ensure that workers are registered and ha...
http://www.aboutyun.com/thread-18683-1-1.html




about云2016年06月01日每日一读

层次聚类算法的原理及实现Hierarchical Clustering
http://www.aboutyun.com/thread-18658-1-1.html
1、如何理解层次聚类?
2、如何理解数据点与组合数据点间的距离?
3、如何求得两个组合数据点间的距离?



Flume+Hadoop+Hive的离线分析系统基本架构(一)
http://www.aboutyun.com/thread-18660-1-1.html
1、如何设计离线分析系架构?
2、Flume如何收集日志信息?
3、如何使用Mapreduce清洗日志文件?


Flume+Hadoop+Hive的离线分析系统基本架构(二)
http://www.aboutyun.com/thread-18662-1-1.html
1、如何使用Mapreduce清洗日志文件?
2、如何使用HIVE建立数据仓库?


资源:

Hadoop在雅虎的应用
http://www.aboutyun.com/thread-18666-1-1.html

Hadoop云计算平台在视频转码上的应用
http://www.aboutyun.com/thread-18667-1-1.html

问答:


spark-shell 执行代码报错
http://www.aboutyun.com/thread-18656-1-1.html

Impala可以读取HDFS和HBASE,两者有什么不同
http://www.aboutyun.com/thread-18657-1-1.html

创建的实例安装软件很慢
http://www.aboutyun.com/thread-18659-1-1.html

关于租户隔离问题
http://www.aboutyun.com/thread-18663-1-1.html

sqoop 1.99.6 server启动不了
http://www.aboutyun.com/thread-18664-1-1.html




about云2016年05月31日每日一读

程序员的薪资是怎么得来的?
http://www.aboutyun.com/thread-18640-1-1.html

1.能力决定薪资?
2.业务与薪资关系?
3."功利心",你有吗?


商品搜索引擎—推荐系统设计
http://www.aboutyun.com/thread-18641-1-1.html
1.推荐系统有什么需要了解?
2.Mahout,你懂多少?
3.如何个性化推荐?


【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(一)
http://www.aboutyun.com/thread-18642-1-1.html

【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(二)
http://www.aboutyun.com/thread-18645-1-1.html

【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(三)
http://www.aboutyun.com/thread-18648-1-1.html


【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(三)
http://www.aboutyun.com/thread-18649-1-1.html

资源:


新浪:发现信息应用之美-数据可视化与SNS分析
http://www.aboutyun.com/thread-18652-1-1.html

腾讯云存储:专业的存储解决方案
http://www.aboutyun.com/thread-18653-1-1.html

问答:

求助服务器宕机之后启动发生如下错误
http://www.aboutyun.com/thread-18636-1-1.html


各位大神,请教一个sqoop2安装后使用时总是报错问题,求指导
http://www.aboutyun.com/thread-18638-1-1.html

sqoop2,将数据导入hive怎么设置
http://www.aboutyun.com/thread-18643-1-1.html

kafka GSSHeader did not find the right tag
http://www.aboutyun.com/thread-18644-1-1.html

mapreduce 处理JSON 数据
http://www.aboutyun.com/thread-18646-1-1.html

跪求哪个大神推荐python实战项目例如(爬虫、Django)或者openstack的nova和keysto...
http://www.aboutyun.com/thread-18650-1-1.html

[ 求助] storm读取kafka数据报错
http://www.aboutyun.com/thread-18651-1-1.html

[求助]storm 读取 kafka数据 有关zookeeper的相关设置
http://www.aboutyun.com/thread-18654-1-1.html




about云2016年05月30日每日一读

Spark多数据源计算实践及其在GrowingIO的实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18615
1.数据处理效率的问题,Spark定义了API的接口,主要有哪3个方式?
2.Spark DataSource实现代码有哪三大类?
3.GrowingIO的数据平台主要分为哪两部分应用?


分布式搜索引擎设计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18616
1.为什么要分布式?
2.如何进行分布式设计?
3.服务功能分布式如何拆分的?


如何在面试中发现优秀程序员
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18624
1.怎样测试简历的真实性?
2.怎样发现实际的经验?
3.怎样验证经验?

NoSQ及相关大数据介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18625
1.NoSQL领域中有哪些技术?
2.如何使用Couchbase?
3.Couchbase 和 ElasticSearch的区别区别是什么?

支撑微博万亿级访问的Redis优化历程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18633
1.怎样实现机制高可用优化?
2.怎样做到业务极致定制?
3.怎样实现Redis服务化?

Spark在微博Feed算法中的应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18634
1.新浪微博的三层架构是怎样的?
2.新浪微博的Feed使用场景?
3.新浪微博的Feed是怎样排序的?

2016年about云05月第05周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18632

资源:
大数据时代:生活、工作与思维的大变革
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18630

大数据可视化与可视化分析的机遇与挑战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18631

问答:
spark运行自带示例看不到效果
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18604

flume写文件到hdfs中,文件过小
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18606

请问一下如何在集合中插入数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18607

安装openstack遇到的奇怪问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18608

安装openstack遇到的奇怪问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18608

nova问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18609

nova指定硬盘大小问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18611

run as scala application找不到
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18612

nova的zone列表怎么查询?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18613

kafka Received -1 when reading from channel, socket has likely been closed.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18614

求助:eclipse远程提交mapreduce任务报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18617

spark启动后没有work进程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18618

hive 出现java.io.IOException: Bad file descriptor 帮忙分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18619

如何将数据放入cache层表中
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18620

dashboard提示认证发生错误。请稍候再试一次。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18621

cinder问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18622

怎么测试spark是否成功
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18626

hadoop-2.2+hbase-0.96集群+nutch1.8 fetch报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18629



about云2016年05月27日每日一读

Spark 附带示例完整解释
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18591
1. 为什么需要scp命令?如何使用scp命令?
2. 从分析日志和分析网页计分的例子中学习如何编写简单Spark程序。
3. Spark作业如何调度?

程序员的面试技巧
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18599


资源:

openstack初步详细部署
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18600


Scala例子讲解英文版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18601



问答:

求助:win7下免Cygwin配置hadoop伪分布模式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18593


spark运行任务中报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18598


CDH页面下载HDFS文件解析地址出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18602


如何通过spark的RDD的转化 去做数据清洗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18586


求一spark详细实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18587


求助storm问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18588


进行nova数据库同步时,出错。请达人帮助;谢谢!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18590


如何使用RDD的转换去分析复杂一点的数据类型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18592


计算圆周率出现如下错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18594


spark的driver和work的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18595


关于hadoop-2.2.0 + hbase-0.96.2集群中nutch版本选择问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18596


谁能帮我看看问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18597






about云2016年05月26日每日一读

网易视频云:基于Hadoop山寨Amazon S3
http://www.aboutyun.com/thread-18577-1-1.html
1.什么是Amazon S3?
2.怎样构建我们自己的HOS(Humor Object Storage)?
3.如何实现我们的HOS?



HBase表管理系统
http://www.aboutyun.com/thread-18576-1-1.html
1. 软件是什么版本和如何部署?
2.系统功能介绍及核心如何实现?
3.如何对表进行增删改查?



怎么使用密码来登录openstack实例
http://www.aboutyun.com/thread-18574-1-1.html

资源:

面试题目-大数据量海量数据处理
http://www.aboutyun.com/thread-18581-1-1.html

使用MongoDB进行伸缩
http://www.aboutyun.com/thread-18580-1-1.html

问答:

squirrel-sql-3.7.1连接phoenix报错!
http://www.aboutyun.com/thread-18582-1-1.html

大神救我ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initial...
http://www.aboutyun.com/thread-18579-1-1.html

求教,CDH版本zookeeper警告是怎么回事?如图
http://www.aboutyun.com/thread-18575-1-1.html

启动spark报错
http://www.aboutyun.com/thread-18572-1-1.html



about云2016年05月25日每日一读

逻辑回归算法的原理及实现(LR)
http://www.aboutyun.com/thread-18562-1-1.html
1、什么是逻辑回归算法?
2、如何理解一元、多元逻辑归回?
3、如何使用逻辑归回模型解决问题?


MapReduce 编程模型在日志分析方面的应用
http://www.aboutyun.com/thread-18564-1-1.html
1、如何理解MapReduce 编程模型?
2、如何对访问网页用户日志进行分析?
3、MapReduce模型如何对应实现?



资源:

scala-2.11.6.tgz+spark-1.5.2-bin-hadoop2.6.tgz
http://www.aboutyun.com/thread-18561-1-1.html

支付宝-海狗的技术原理与实现
http://www.aboutyun.com/thread-18569-1-1.html

丛磊-Nosql在SAE中的应用
http://www.aboutyun.com/thread-18570-1-1.html

问答:

求大神解决问题-hive-mapreduce问题
http://www.aboutyun.com/thread-18559-1-1.html

求助:
http://www.aboutyun.com/thread-18560-1-1.html

MapReduce 如何一次统计多个指标
http://www.aboutyun.com/thread-18563-1-1.html

有没有用mapreduce实现决策树的?
http://www.aboutyun.com/thread-18565-1-1.html

centos7 openstack swift stat 报错
http://www.aboutyun.com/thread-18566-1-1.html

CDH配置kerberos后无法重启
http://www.aboutyun.com/thread-18567-1-1.html

MR任务在reduce阶段超时!
http://www.aboutyun.com/thread-18568-1-1.html




about云2016年05月24日每日一读

Hive on Spark入门设置【编程】
http://www.aboutyun.com/thread-18547-1-1.html
1.从哪个版本开始,Hive on Spark已经成为Hive代码的一部分了?
2.在Hive中使用Spark执行引擎,需要做哪些配置准备?
3.hive有哪两种加载Spark相关包的方法?


Python爬虫和情感分析简介
http://www.aboutyun.com/thread-18548-1-1.html
1.什么是情感分析
2.Python爬虫如何编写?
3.如何特征转化?



程序员也要养生
http://www.aboutyun.com/thread-18546-1-1.html
1.程序员如何养生?
2.程序员需要注意什么?
3.程序员的健康问题有哪些方面引起?


资源:

Java基础资料
http://www.aboutyun.com/thread-18554-1-1.html

深入JVM内核—原理、诊断与优化
http://www.aboutyun.com/thread-18553-1-1.html

R语言进阶
http://www.aboutyun.com/thread-18552-1-1.html


问答:

如何配置hive,使hive能使用spark引擎
http://www.aboutyun.com/thread-18545-1-1.html

用swift做cinder的备份驱动,配置文件怎么写
http://www.aboutyun.com/thread-18544-1-1.html

hbase数据统计:spark VS 协处理器+过滤器 哪种更有优势
http://www.aboutyun.com/thread-18543-1-1.html

nova运维问题求助
http://www.aboutyun.com/thread-18540-1-1.html

如何修改yarn/cluster的时间格式
http://www.aboutyun.com/thread-18549-1-1.html

添加journalnode需要重新格式吗
http://www.aboutyun.com/thread-18551-1-1.html

求助帖:实例状态为ERROR
http://www.aboutyun.com/thread-18550-1-1.html

大数据问题求助
http://www.aboutyun.com/thread-18557-1-1.html

hive问题求助
http://www.aboutyun.com/thread-18555-1-1.html

HBase “Failed getting lock in batch put”错误的疑问
http://www.aboutyun.com/thread-18556-1-1.html



about云2016年05月23日每日一读


TaskScheduler内幕天机:Spark shell案例,TaskScheduler和SchedulerBackend、FIFO...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18534


1.什么是TaskSchedulerBackend、SchedulerBackend?
2.FIFO与FAIR两种调度模式有什么区别?
3.Task数据本地性资源怎样分配的?



Lucene全文搜索原理与使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18535
1.什么是结构化数据与非结构化数据
2.什么是全文检索?
3.Lucene实现全文搜索的流程是怎样的



架构大数据分析应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18514
1.如何定义大数据表征?
2.架构数据分析应用本文用到了哪些技术?
3.本文是如何规划大数据架构的?


基于Redis实现简单的分布式锁
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18513
1.本文分布式锁说了哪些要点?
2.基于Redis单例如何实现?
3.基于Redlock算法如何实现的?


Redis网络架构及单线程模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18522
1.Redis网络层基础组件主要包括哪几部分?
2.什么是Redis的单线程模型?
3.Redis怎样接收网络连接?



优秀程序员的十个习惯
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18523


2016年about云05月第04周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18529


资源:

hbase在淘宝应用及改进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18537


Linux在淘宝环境中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18538



问题:

Hadoop2.7实战v1.0之Linux参数调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18501


hive 实现并发执行多任务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18503


求助!!Mapreduce 使用distributedCache 的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18506


hbase节点断网后不能正常连入集群
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18507


hadoop中出现Java heap space
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18509


x point org.apache.nutch.net.URLNormalizer not found.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18511


MapReduce查找相邻记录
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18512



hbase启动时报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18515


HA+Federation中datanode格式化出现异常...不能为多个namenode提供服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18516


hadoopHA运行mapreduce报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18517


spark输出log信息中怎么过滤INFO信息
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18519


storm nimbus 起不来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18520


hbase分组统计问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18521


CDH5.7sqoop导入hbase报错HBase jars are not present in classpath
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18524


hive执行多表关联卡住不动问题解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18528


Kafka server启动问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18532


Mapreduce 的组合依赖关系的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18533





about云2016年05月20日每日一读


Apache Flink:详细入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18491
1.Apache Flink是什么?
2.Flink在实现流处理和批处理时,与传统的一些方案有什么不同?
3.Apache Flink流处理有哪些特性?


Spark:Master High Availability(HA)高可用配置的2种实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18498
1. Spark的HA实现可以通过哪几种方式实现?
2. 基于文件系统的单点恢复实现HA如何配置?
3. 基于zookeeper的Standby Masters实现HA如何配置?



资源:

淘宝:分布式存储与TDDL2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18492


LVS在淘宝环境中的应用(追风堂)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18493



问答:

hive启动元数据库报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18486


spark提交application,Initial job has not accepted any resources
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18490


怎么确认hadoop HA环境的mapreduce是正常的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18494


hive创建hbase外部表的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18495


不知道从哪里开始看
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18497




about云2016年05月19日每日一读

为 Mahout 增加聚类评估功能
http://www.aboutyun.com/thread-18474-1-1.html
1.聚类(clustering)是无监督学习还是监督学习?
2.什么是聚类评估算法?
3.如何产生聚类需要的向量文件?



我是如何准备技术面试的
http://www.aboutyun.com/thread-18480-1-1.html
1.经历过哪些面试?
2.新美大面试如何?
3.腾讯的面试如何?
4.面试前需要的准备?


理解 OpenStack 高可用(2):虚拟路由冗余协议
http://www.aboutyun.com/thread-18482-1-1.html
1.虚拟路由冗余协议 - VRRP 是什么?
2.什么是Keepalived



关于HTML5和CSS替换使用
http://www.aboutyun.com/thread-18471-1-1.html

mahout什么是向量
http://www.aboutyun.com/thread-18473-1-1.html


资源:

基于MapReduce的加权Voronoi图并行算法设计及应用
http://www.aboutyun.com/thread-18477-1-1.html

KVM虚拟化实战视频
http://www.aboutyun.com/thread-18478-1-1.html


问答:

为啥mahout将SquenceFile转换成向量的时候没有产生cluster?
http://www.aboutyun.com/thread-18468-1-1.html

请问有人用过Oozie的JMS通知功能吗?
http://www.aboutyun.com/thread-18469-1-1.html

hdfs的副本数量是否hbase的查询性能有影响
http://www.aboutyun.com/thread-18470-1-1.html

hadoop指定文件输入参数问题
http://www.aboutyun.com/thread-18476-1-1.html

CM5.7+CDH5.5.3运行过程中zookeeper的连接数总是在增长
http://www.aboutyun.com/thread-18479-1-1.html

reduce阶段跑不通
http://www.aboutyun.com/thread-18481-1-1.html

HCatlog访问Hive的问题
http://www.aboutyun.com/thread-18483-1-1.html

hadoop jar包导入javaweb项目中tomcat起不来
http://www.aboutyun.com/thread-18484-1-1.html




about云2016年05月18日每日一读

zookeeper错误排除总结
http://www.aboutyun.com/thread-18448-1-1.html

Flume+Kafka收集Docker容器内分布式日志应用实践
http://www.aboutyun.com/thread-18452-1-1.html
1、如何设计Flume+Kafka收集架构?
2、如何修改Docker内配置文件?
3、如何进行Flume配置?
4、如何定制RollingByTypeAndDayFileSink?


程序员,我们都是夜归人
http://www.aboutyun.com/thread-18453-1-1.html
1、程序员为什么需要加班?
2、做好哪些方面可以避免加班?

hive 2.0.0遇到问题总结
http://www.aboutyun.com/thread-18456-1-1.html

资源:

搜索引擎构建与爬虫技术[全套视频]
http://www.aboutyun.com/thread-18464-1-1.html

搜搜-机器学习平台汇报
http://www.aboutyun.com/thread-18465-1-1.html

问答:

hbase启动问题
http://www.aboutyun.com/thread-18441-1-1.html

求解
http://www.aboutyun.com/thread-18442-1-1.html

启动hive时候报如下错误
http://www.aboutyun.com/thread-18443-1-1.html

救助!eclipse win7上远程无法提交job
http://www.aboutyun.com/thread-18445-1-1.html

Resourse里面的时间应该怎么转换时区?
http://www.aboutyun.com/thread-18446-1-1.html

map端数据倾斜
http://www.aboutyun.com/thread-18447-1-1.html

怎么提高hbase压缩数据的速度
http://www.aboutyun.com/thread-18450-1-1.html

求一hive2.0配置
http://www.aboutyun.com/thread-18454-1-1.html

spark配置ha(用zookeeper)
http://www.aboutyun.com/thread-18455-1-1.html

大神赐教cinder 备份方面的
http://www.aboutyun.com/thread-18457-1-1.html

安装配置计算节点的问题求解答
http://www.aboutyun.com/thread-18458-1-1.html

初学者求助
http://www.aboutyun.com/thread-18459-1-1.html

OpenStack一体机
http://www.aboutyun.com/thread-18460-1-1.html

有人了解org.apache.hadoop.hbase.client.Put这个包吗?
http://www.aboutyun.com/thread-18463-1-1.html

CDH5.7 启动namenode报错Connection Refused
http://www.aboutyun.com/thread-18466-1-1.html



about云2016年05月17日每日一读

程序员你为什么这么忙?
http://www.aboutyun.com/thread-18429-1-1.html
1.目标比结果重要?
2.做好一件事,胜于做过十件事?
3.如何减少犹豫?


理解 OpenStack 高可用(1):OpenStack 高可用和灾备方案(上)
http://www.aboutyun.com/thread-18430-1-1.html
1.什么是HA?
2.OpenStack HA有几类?
3.OpenStack HA的方案有哪些?



Oozie 中Suspend状态的作业可以通过resume来恢复执行
http://www.aboutyun.com/thread-18428-1-1.html


资源:

云计算Docker虚拟化全套教程分享【限时】
http://www.aboutyun.com/thread-18438-1-1.html

华为FusionInsight HD 2.3基础技术-Spark
http://www.aboutyun.com/thread-18439-1-1.html

问答:

map如何处理分块数据,保证数据的完整性
http://www.aboutyun.com/thread-18425-1-1.html

使用open vswitch构建虚拟网络
http://www.aboutyun.com/thread-18426-1-1.html

HDFS主机上硬盘问题
http://www.aboutyun.com/thread-18431-1-1.html

Nova配置多个Hypervisor
http://www.aboutyun.com/thread-18432-1-1.html

新手刚接触openstack,望大神指导下
http://www.aboutyun.com/thread-18433-1-1.html

hdfs对历史文件压缩
http://www.aboutyun.com/thread-18434-1-1.html

关于cloudera异常bad-health告警如何解决
http://www.aboutyun.com/thread-18435-1-1.html

构建hadoop的ha,ResourceManager和DFSZKFailoverController会挂掉,报错如下
http://www.aboutyun.com/thread-18436-1-1.html

求大神解决mitaka  horizon登不上去
http://www.aboutyun.com/thread-18437-1-1.html



about云2016年05月16日每日一读

将 Spark 中的文本转换为 Parquet 以提升性能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18422
1.什么是Parquet?
2.Hbase怎样转换为Parquet



使用 Spark Streaming 检测关键词
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18420
1.什么是Spark Streaming?
2.怎样用Spark Streaming做关键词检测?
3.怎样实现关键词检测程序?




e袋洗的微服务架构之路与Docker实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18407
1.为什么要拆成微服务的架构?
2.单体架构有什么问题?
3.拆分微服务可能会带来的问题?



用实例讲解Spark Sreaming
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18409
1.什么是Spark Streaming?
2.Spark Streaming如何工作?
3.怎样实现Spark Streaming?



基于MapReduce的计算几何--CG_Hadoop
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18393
1.什么是CG_Hadoop?
2.CG_Hadoop有哪几个基础操作?
3.CG_Hadoop具有哪两个版本?


2016年about云05月第03周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18417


乐视+金山+360面试经历与感受--积累很重要
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18394

hadoop常见错误汇总【2016】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18421


资源:
为什么Docker是云计算必然的现在和未来1【视频】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18418


深入Docker的镜像、容器和仓库以及测试下的Docker2【视频】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18419


hadoop集群环境所需资源汇总 之安装文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18403





问答:
yarn-clientm模式下无法找到第三方jar包的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18395


namenode和resourcemanager启动不了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18405


keystone问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18387


CDH 纯离线方式安装之后没有hadoop和spark等命令?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18391


mapreduce求图中点组成的多边形个数···
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18390


求助! 服务器突然断电后再启动CDH时cloudera-scm-server无法启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18389


namenode的元数据问题

http://www.aboutyun.com/forum.php?mod=viewthread&tid=18388


nova 取不到token问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18392


咨询一个HBase集群问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18396


hive2.0多表操作问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18397


hive查询时出错,求大神帮助啊!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18399


neutron gre网络模式下,实例获取不到ip地址
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18404


想知道NBA是如何收集比赛,球员数据的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18406


【已解决】CDH5.7Hue使用sqoop导出mysql数据报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18411


关于hadoop的classpath问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18412


同学面试的hadoop一些题,求大牛一起解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18413


hive不能删除表,建表也出现问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18415




已有(1)人评论

跳转到指定楼层
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条