分享

about云每日一读汇总(第七篇2015.03.01)

本帖最后由 pig2 于 2015-5-1 01:15 编辑
about云2015年05月01日每日一读

每天进步一点点


程序员越来越值钱了
http://www.aboutyun.com/thread-12850-1-1.html
1、程序员行业的知识芜杂海量,程序员需要抓住的不变量是?
2、大学期间我们最应该学的是什么?
3、基础知识永不过时,以不变应万变。



大数据流式计算三种框架:Storm,Spark和Samza
http://www.aboutyun.com/thread-12852-1-1.html
1.大数据流式计算框架有哪三种,分别有什么不同?
2.数据传递的形式分为哪三类?
3.有哪些公司在使用这三种大数据流式计算框架?

Spark朴素贝叶斯(naiveBayes)
http://www.aboutyun.com/thread-12853-1-1.html
1.什么是朴素贝叶斯?
2.朴素贝叶斯运行在什么样的场景下?
3.朴素贝叶斯计算流程是什么?

如何在不同操作系统部署Docker环境
http://www.aboutyun.com/thread-12851-1-1.html
1、Docker是什么?
2、Ubuntu作为Docker的首个运行平台,如何安装运行Docker?
3、由于Dokcer基于Linux内核的一些功能,不能在原生地在OS X系统上运行,那么需要如何配置使其可运行Docker?




Hive分析窗口函数(四) LAG,LEAD,FIRST_VALUE,LAST_VALUE
http://www.aboutyun.com/thread-12848-1-1.html
1.LAG功能是什么?
2.LEAD与LAG功能有什么相似的地方那个?
3.FIRST_VALUE与LAST_VALUE分别完成什么功能?


Hive分析窗口函数(五) GROUPING SETS,GROUPING__ID,CUBE,ROLLUP
http://www.aboutyun.com/thread-12849-1-1.html
1.GROUPING SETS与另外哪种方式等价?
2.根据GROUP BY的维度的所有组合进行聚合由哪个关键字完成?
3.ROLLUP与ROLLUP关系是什么?

kafka入门介绍及环境搭建
http://www.aboutyun.com/thread-12847-1-1.html
1.kafka是否需要zookeeper?
2.kafka是什么?
3.kafka包含哪些概念?
4.如何模拟客户端发送、接受消息初步测试?
5.kafka cluster怎么同zookeeper交互的?


资源:

医药-生物大数据的时代
http://www.aboutyun.com/thread-12854-1-1.html

一个数据分析师眼中的柴静雾霾调查
http://www.aboutyun.com/thread-12855-1-1.html

问答:

DataNode机器上的数据块丢失会不会造成它所占据的磁盘空间无法利用?
http://www.aboutyun.com/thread-12839-1-1.html

yarn资源设置的一些疑问
http://www.aboutyun.com/thread-12842-1-1.html

openstack网络问题
http://www.aboutyun.com/thread-12840-1-1.html


kafka问题请教
http://www.aboutyun.com/thread-12843-1-1.html


为什么openstcak上创建很多虚拟机,会不能“nova list”?
http://www.aboutyun.com/thread-12844-1-1.html


glance上传镜像提示HTTP500错误
http://www.aboutyun.com/thread-12845-1-1.html

问个问题,虚拟机之间ping不通,怎么办?在线等
http://www.aboutyun.com/thread-12838-1-1.html


在opencontrail中有svc_monitor,请问这是什么?
http://www.aboutyun.com/thread-12841-1-1.html






about云2015年04月30日每日一读

每天进步一点点


架构师之路:秒杀系统架构优化思路
http://www.aboutyun.com/thread-12829-1-1.html
1.流量到了亿级别,常见站点架构如何设计?
2.如何优化亿级别站点?
3.本文对于优化总结哪两个思路?


YouTube系统架构学习与解析
http://www.aboutyun.com/thread-12830-1-1.html
1.YouTube使用了哪些技术?
2.YouTube开发人员多少及访问量如何?
3.YouTube数据库是如何发展的,早期、后期分别是什么情况?



Hive分析窗口函数(一) SUM,AVG,MIN,MAX
http://www.aboutyun.com/thread-12831-1-1.html
1、Hive分析窗口函数SUM如何实现?
2、Hive分析窗口函数AVG脚本如何编写?
3、Hive分析窗口函数MIN、MAX脚本如何实现?


Hive分析窗口函数(二) NTILE,ROW_NUMBER,RANK,DENSE_RANK
http://www.aboutyun.com/thread-12834-1-1.html
1.NTILE作用是什么?
2.按照pv降序排列,生成分组内每天的pv名次可使用哪个窗口函数?
3.RANK 和 DENSE_RANK作用是什么?


Hive分析窗口函数(三) CUME_DIST,PERCENT_RANK
http://www.aboutyun.com/thread-12834-1-1.html
1、CUME_DIST如何使用?
2、PERCENT_RANK作用是什么?


资源:


RabbitMQ in Action【英文本314页】
http://www.aboutyun.com/thread-12832-1-1.html

电子书-Pro Hadoop-英文【推荐】
http://www.aboutyun.com/thread-12835-1-1.html


问答:


mapreduce可以调用windows平台下的.dll动态库的方法吗?
http://www.aboutyun.com/thread-12826-1-1.html



Hadoop2.6.0 集群能够正常启动,为什么却提示datanode的数目为0?
http://www.aboutyun.com/thread-12828-1-1.html







about云2015年04月29日每日一读

每天进步一点点


剖析Docker项目的组织架构
http://www.aboutyun.com/thread-12821-1-1.html
1.Docker有多个类型的Maintainer,所有的Maintainer都有哪三个共同点?
2.BDFL的日常工作包括哪些?
3.Docker的组织架构包含哪些内容?

HTML5十四款开发工具介绍
http://www.aboutyun.com/thread-12822-1-1.html

1.下面那个工具可以同时兼容移动设备和桌面电脑?
2.Sencha Architect 2有什么特点?
3.哪个开发工具用于开发浏览器应用?

Hbase对于大对象存储的三种主要解决方案
http://www.aboutyun.com/thread-12818-1-1.html


关于 iptables 和 tc 的限速理解-01
http://www.aboutyun.com/thread-12810-1-1.html
1、什么是iptables?
2、iptables对于包的过滤顺序是如何的?
3、什么是数据包?



关于 iptables 和 tc 的限速理解-02
http://www.aboutyun.com/thread-12811-1-1.html
1、什么是tc(TC-Traffic Control)?
2、tc的测试流程介绍
3、如何建立tc策略?



说说Zookeeper中的ACL
http://www.aboutyun.com/thread-12816-1-1.html
1、如何理解ZooKeeper中的ACL?
2、了解ACL的如何实现以及Server配置?
3、ACL如何进行管理?


ZooKeeper 常用操作API详解
http://www.aboutyun.com/thread-12817-1-1.html
1、ZooKeeper的常用API方法都有那些?
2、Zookeeper 到底能帮我们解决那些问题?
3、如何实现共享锁(Locks)?

OpenStack打包方法总结
http://www.aboutyun.com/thread-12820-1-1.html
1、openstack打包有哪些方法?
2、你怎么打包的?

问答:

请教:在opencontrail上创建实例,为什么同步不到openstack上?
http://www.aboutyun.com/thread-12812-1-1.html


求大数据解决方案。。大神。come on!
http://www.aboutyun.com/thread-12814-1-1.html

请教,openstack结合opencontrail后,为什么在菜单栏选网络,会出现“报错”
http://www.aboutyun.com/thread-12815-1-1.html


Keepererrorcode=connectionloss for /hbase/meta-region-server
http://www.aboutyun.com/thread-12819-1-1.html

资源:
Hadoop MapReduce v2 Cookbook【第二版英文322页】(2015)
http://www.aboutyun.com/thread-12824-1-1.html

30个让数据可视化的工具
http://www.aboutyun.com/thread-12823-1-1.html

基于Spark-on-Yarn的淘宝数据挖掘平台
http://www.aboutyun.com/thread-12809-1-1.html

模式识别(第三版)【564页】【算法】
http://www.aboutyun.com/thread-12808-1-1.html








about云2015年04月28日每日一读

每天进步一点点


2015年大数据顶尖职位必备的9项技能
http://www.aboutyun.com/thread-12805-1-1.html
1.本文说了哪9项技能?
2.你会下面几种?
3.你认为下面9中是否都有可能掌握?


微博广告推荐中使用Hadoop系统架构介绍及遇到的问题及解决方案
http://www.aboutyun.com/thread-12804-1-1.html
1.在hadoop平台上进行开发时,主要哪些问题?
2.数据量庞大、HDFS数据与线下交互不便是如何解决的?
3.业务逻辑复杂且运行过程不便监控是如何解决的?


新手指导:教你如何查看识别hadoop是32位还是64位
http://www.aboutyun.com/thread-12796-1-1.html
1.从哪些地方可以识别hadoop是32位还是64位?
2.hadoop本地库在什么位置?

hadoop2.7【单节点】单机、伪分布、分布式安装指导
http://www.aboutyun.com/thread-12798-1-1.html
1.从本文部署实际部署,总结本地模式、伪分布、分布式的区别是什么?
2.单机是否是伪分布?
3.本地模式是否可以运行mapreduce?

2015年度云计算使用调查报告
http://www.aboutyun.com/thread-12806-1-1.html

Phoenix 4.3.0 与 Hbase0.98.10-hadoop2的整合,hbase0.98
http://www.aboutyun.com/thread-12800-1-1.html
1.Phoenix 4.3.0 与 Hbase0.98.10-hadoop2如何整合?
2.Phoenix 4.3.0 与 Hbase0.98.10-hadoop2本文是如何解决的?
3.重新编译Phoenix包含哪些步骤?



问答:


hadoop fs –mkdir input 就显示master:9000 connection refused
http://www.aboutyun.com/thread-12793-1-1.html

hive sql异常:Encountered unregistered class ID,求解决???
http://www.aboutyun.com/thread-12795-1-1.html


无法写入文件在hdfs中
http://www.aboutyun.com/thread-12797-1-1.html


CDH5.3.1版本跟Phoenix配置的问题
http://www.aboutyun.com/thread-12799-1-1.html

求助:openstack启动虚拟机失败!!
http://www.aboutyun.com/thread-12801-1-1.html

求问大神,Cloudera的大数据平台有什么缺陷没有?功能不完善的地方?
http://www.aboutyun.com/thread-12802-1-1.html








about云2015年04月27日每日一读

每天进步一点点


Baidu:Spark技术内幕
http://www.aboutyun.com/thread-12781-1-1.html
1.什么是Spark?
2.Spark的核心组件有哪些?
3.Spark整体架构如何?
4.资源分配、任务调度、DAG划分、Task生成和执行、Shuffle Pluggable 框架、存储的实现?

在openstack实例中做HA,实现Web双机热备
http://www.aboutyun.com/thread-12776-1-1.html
1.在配置HA的时候做了哪些准备工作?
2.两个实例中如何配置实现Web双机热备?
3.如何测试是否双机热备?



面向 Java 开发人员的 Scala 指南: 面向对象的函数编程
http://www.aboutyun.com/thread-12783-1-1.html
1、什么是Scala语言,以及Scala语言的下载和安装?
2、scala中函数概念包括哪些?
3、怎么将将函数和表单最终结合起来?

面向 Java 开发人员的 Scala 指南: Scala 控制结构内部揭密
http://www.aboutyun.com/thread-12786-1-1.html
1、scala中控制语句怎么使用?
2、怎么去编写自己的语言结构?
3、"for" 生成语言怎么使用?
4、scala中的简单性有哪些?
5、Scala 中match怎么使用?





面向 Java 开发人员的 Scala 指南: 类操作
http://www.aboutyun.com/thread-12784-1-1.html
1、Scala 和JAVA中类的差别?
2、Scala 中用多少种方法构造类?
3、Scala的核心内幕是什么?



Intel李锐:Hive on Spark解析
http://www.aboutyun.com/thread-12780-1-1.html
1.Hive on Spark的总体设计思路什么?
2.Hive on Spark有哪几个重要的实现细节?
3.Hive on Spark支持哪两种运行模式?
4.如何对Hive on Spark优化?


Hadoop学习之配置Eclipse远程调试Hadoop
http://www.aboutyun.com/thread-12787-1-1.html
1、什么是JPDA?
2、如何配置Eclipse调试Hadoop?



scala的implicit和magnet模式
http://www.aboutyun.com/thread-12789-1-1.html
1、什么是scala?
2、什么是magnet模式?
3、ExecutionContext的获取方法有?



about云2015年04月第三周经典回顾
http://www.aboutyun.com/thread-12782-1-1.html

资源:

CentOS7.1+OpenStack-Juno
http://www.aboutyun.com/thread-12790-1-1.html

BAT实习内推笔试卷
http://www.aboutyun.com/thread-12791-1-1.html

问答:


opentack-all-in-one 安装配置教程
http://www.aboutyun.com/thread-12775-1-1.html

有听说ZStack的吗?有没有相关资源
http://www.aboutyun.com/thread-12777-1-1.html

windows下eclipse连接ubuntu中hadoop(伪分布式)的问题?
http://www.aboutyun.com/thread-12778-1-1.html


elasticsearch通配符查询或者lucene通配符查询
http://www.aboutyun.com/thread-12785-1-1.html







about云2015年04月26日每日一读

每天进步一点点



阿里巴巴技术专家杨晓明:基于Hadoop技术进行地理空间分析
http://www.aboutyun.com/thread-12766-1-1.html
1.如何将交通领域产生的海量车辆位置信息和道路关联而进行统计操作?
2.如何判断一个点是否包含于一个多边形内部,有哪两种方法?
3.如何在Reducer方法中进行高效的空间关系判断,有哪几个步骤?



盘点SQL on Hadoop中用到的主要技术
http://www.aboutyun.com/thread-12765-1-1.html
1.实时框架跟MPP架构的对比如何?
2.一个SQL on Hadoop系统一般都会有哪些通用的核心组件?
3.从SQL到执行计划有哪5步?
4.资源如何控制?


从零教你在Linux环境下(ubuntu 12.04)如何编译hadoop2.X
http://www.aboutyun.com/thread-12769-1-1.html
1.如果获取hadoop src  maven包?
2.编译hadoop需要装哪些软件?
3.如何编译hadoop2.4?
扩展:
编译hadoop为何安装这些软件?


Redis 3.0中文官方文档翻译计划(17) ——集群(下)
http://www.aboutyun.com/thread-12759-1-1.html
1、怎么手动故障转移?
2、怎么去添加移除升级新节点?
3、怎么迁移到Redis集群?


Ubuntu14.04安装配置Hadoop2.6.0(完全分布式)与 wordcount实例运行
http://www.aboutyun.com/thread-12762-1-1.html
1、hadoop怎么去创建目录?
2、怎么想hdfs写入内容?
3、怎么在hdfs里面创建目录?
4、在hdfs上面文件怎么拷贝?
5、hdfs里面文件怎么查看?
6、在hdfs上面怎么去执行wordcount程序?
7、怎么去查看wordcount的执行结果?



Hadoop 多表 join:map side join 范例
http://www.aboutyun.com/thread-12763-1-1.html
1.map side join适用于那些情况?
2.使用reduce side join的原因是什么?
3.使用reduce side join存在什么缺点?



Python基础笔记-02
http://www.aboutyun.com/thread-12767-1-1.html
1、什么是函数?什么是迭代?
2、如何编写函数?
3、如何切片?


资源:

大数据技术发展的两大方向和最新进展
http://www.aboutyun.com/thread-12770-1-1.html

腾讯2015春招后台开发练习卷
http://www.aboutyun.com/thread-12773-1-1.html

寻路推荐 - 豆瓣推荐系统实践之路
http://www.aboutyun.com/thread-12772-1-1.html

智能推荐系统【28页】
http://www.aboutyun.com/thread-12771-1-1.html


问答:


storm并发度引发的问题
http://www.aboutyun.com/thread-12760-1-1.html

【坐等大牛】关于cinder连存储的问题
http://www.aboutyun.com/thread-12764-1-1.html

Connection refused while opening trackingUI URL
http://www.aboutyun.com/thread-12768-1-1.html







about云2015年04月25日每日一读

每天进步一点点

Facebook 的 Flux 应用架构介绍
http://www.aboutyun.com/thread-12755-1-1.html
1.Flux的作用是什么?
2.在比较Flux和MVC时,需理解哪三件事?
3.Flux使事情可预测,为什么这么说?


Ubuntu 15.04 发布,支持 OpenStack Kilo 和 LXD Hypervisor
http://www.aboutyun.com/thread-12756-1-1.html
1.Ubuntu 15.04 发布包含哪些新特性?
2.Ubuntu 做了哪些承诺?企业版是否免费?
3.Ubuntu 15.04 发布是否支持openstack最新版本kilo?


hadoop2.7版本发布:新增功能及改变【不在支持jdk1.6】
http://www.aboutyun.com/thread-12737-1-1.html


Hadoop权威指南学习笔记
http://www.aboutyun.com/thread-12746-1-1.html
1、如何初级Hadoop?
2、如何搭建集群?
3、学习HDFS和MapReduce的原理和设计?


Mahout安装与配置
http://www.aboutyun.com/thread-12747-1-1.html
1、如何安装Mahout?
2、Mahout使用准备?
3、kmeans算法的运用?


Hadoop - MapReduce MRAppMaster-剖析
http://www.aboutyun.com/thread-12749-1-1.html
1、MRAppMaster 主要由哪几种组件/服务组成?
2、MRAppMaster提供了哪三种作业运行模式?
3、MRAppMaster 生命周期?









资源:


Mahout进阶【限时下载】
http://www.aboutyun.com/thread-12757-1-1.html

hbase数据备份方法文档【25页】
http://www.aboutyun.com/thread-12744-1-1.html


ubuntu linux命令行简明教程和中文教程
http://www.aboutyun.com/thread-12754-1-1.html




问答:

利用hive,怎么统计每个页面的访问时间
http://www.aboutyun.com/thread-12735-1-1.html


openstack虚拟机一直创建
http://www.aboutyun.com/thread-12736-1-1.html

每台都要安装hadoop及关联包,这该多累啊?
http://www.aboutyun.com/thread-12738-1-1.html

我是如何向老婆解释MapReduce的?【转】
http://www.aboutyun.com/thread-12739-1-1.html

hbase-indexer running processes为 0的问题
http://www.aboutyun.com/thread-12740-1-1.html

Wordcount复制过来的函数,不知道为什么报错
http://www.aboutyun.com/thread-12741-1-1.html


hbase备份以及导出问题。
http://www.aboutyun.com/thread-12742-1-1.html

MapSideJoin问题,求解
http://www.aboutyun.com/thread-12743-1-1.html

安装CDH2.2后页面显示“无法发出查询:Host Monitor未运行”
http://www.aboutyun.com/thread-12751-1-1.html

发一个no route to host的问题及解决吧
http://www.aboutyun.com/thread-12752-1-1.html









about云2015年04月24日每日一读

每天进步一点点



技术人才的出路在哪里,5种选择和2种思路
http://www.aboutyun.com/thread-12725-1-1.html
1、技术人才的职业发展方向?
2、在一个有前景的平台,扎扎实实干?
3、搭建自己的小平台,扎扎实实做大?



后Hadoop时代的大数据架构
http://www.aboutyun.com/thread-12733-1-1.html
1.Google 新三辆马车是哪三门技术?
2.Spanner、F1、Dremel分别是什么技术?
3.后Hadoop时代的大数据架构主要讲了什么内容?


Django入门必读
http://www.aboutyun.com/thread-12726-1-1.html
1.Django是如何处理Http Resquest的?
2.在浏览器输入了 http://127.0.0.1:8000/polls/,接下来浏览器会把请求交给Django处理,它是如何处理的?
3.Django中 urls.py文件的作用是什么?


redis存储和查询的java实现
http://www.aboutyun.com/thread-12728-1-1.html
1、Redis是什么?
2、Redis的性能如何?
3、redis.conf的主要配置参数的意义?



【机器学习基础】软间隔支持向量机
http://www.aboutyun.com/thread-12727-1-1.html
1、什么是软间隔支持向量机?
2、核软间隔支持向量机的算法步骤?
3、SVM留一交叉验证误差与支持向量的关系?




资源:

数据挖掘概念与技术【642页】
http://www.aboutyun.com/thread-12732-1-1.html


hadoop2.x(2.7、2.6、2.5.1、2.5.2、2.4.0)各个版本各种插件下载about云网络书籍
http://www.aboutyun.com/thread-12731-1-1.html

about云4-ubuntu准备工作网络配置
http://www.aboutyun.com/thread-12710-1-1.html

问答:

【求助】CDH版本中Mahout怎么调用?
http://www.aboutyun.com/thread-12722-1-1.html

求助!nova 命令不能用
http://www.aboutyun.com/thread-12721-1-1.html

hive与hbase集成求教
http://www.aboutyun.com/thread-12720-1-1.html

小文件合并成大文件
http://www.aboutyun.com/thread-12730-1-1.html

求问 kafka作为消息中间件怎么与hadoop集成?
http://www.aboutyun.com/thread-12719-1-1.html

cdh5.3.3安装过程中遇到的问题
http://www.aboutyun.com/thread-12718-1-1.html

glance image-delete 失败
http://www.aboutyun.com/thread-12729-1-1.html

公司MAC地址绑定,虚拟机连不上外网怎么办?
http://www.aboutyun.com/thread-12724-1-1.html


远程创建hbase表同样的代码在不同的java文件中有时成功有时报错?
http://www.aboutyun.com/thread-12723-1-1.html

求教Hive使用UDF将查询结果导入MySQL中,为什么总是多出两条记录?
http://www.aboutyun.com/thread-12717-1-1.html

请教:为什么会有这么多nova-api进程?
http://www.aboutyun.com/thread-12716-1-1.html

kafka问题也莫名shutdown
http://www.aboutyun.com/thread-12715-1-1.html

又是一个难解的storm问题,拜谢各位看看
http://www.aboutyun.com/thread-12714-1-1.html

oozie报错问题求解
http://www.aboutyun.com/thread-12713-1-1.html

求助:hadoop项目
http://www.aboutyun.com/thread-12712-1-1.html

貌似是override,具体看不太懂,求助
http://www.aboutyun.com/thread-12711-1-1.html







about云2015年04月23日每日一读

每天进步一点点



hadoop2.7 64位编译插件下载及编译过程记录、问题总结
http://www.aboutyun.com/thread-12695-1-1.html
1.什么情况下会发生Could not resolve dependencies?
2.什么情况下会出现No such file or directory?


程序员可以进入机器学习领域
http://www.aboutyun.com/thread-12698-1-1.html
1、学习机器学习需要具备那些数学知识?
2、对于机器学习,很强的数学功底真的这么重要吗?
3、对于机器学习,哪些技能是必须的呢?



不到100行代码实现一个简单的推荐系统:以电影为例
http://www.aboutyun.com/thread-12703-1-1.html
1.推荐系统的第一步你认为是做什么,本文是如何认为的?
2.相似度在推荐系统中起着什么作用?
3.什么是数据标准化(归一化)处理?
4.找到某观影人可能喜欢的电影,找到对某影片感兴趣的人的思路是什么?



初探Openstack Neutron DVR
http://www.aboutyun.com/thread-12696-1-1.html
1、不使用DVR会出现什么问题?
2、东西向流量traffic是怎么走的?


Docker Swarm入门(四)Demo
http://www.aboutyun.com/thread-12697-1-1.html
1、如何使Docker Swarm集群运行起来以及如何与它进行交互?
2、如何搭建集群?
3、浏览器中访问Consul的地址是?


在线广告公司是如何使用spark的
http://www.aboutyun.com/thread-12699-1-1.html
1.使用spark,广告公司发生了什么变化?
2.spark能否处理批处理?


Map/Reduce Task 远程调试详解
http://www.aboutyun.com/thread-12705-1-1.html
1.TaskTracker的Child进程是哪两个?
2.调试 Map/Reduce Task与那三个属性有关?
3.如果希望远程调试MapTask或则ReduceTask该如何配置?
4.调试 JobTracker/TaskTracker,该如何配置?



hadoop2.x各个版本汇总:新增功能最新编译 32位、64位安装、源码包、API、eclipse插件
http://www.aboutyun.com/thread-12707-1-1.html


如何高效的阅读hadoop源代码?
http://www.aboutyun.com/thread-12700-1-1.html


资源:


hadoop2.7汇总:新增功能最新编译64位安装、源码包、API、eclipse插件下载
http://www.aboutyun.com/thread-12694-1-1.html

[数学建模方法].杨学桢.扫描版【416页】
http://www.aboutyun.com/thread-12708-1-1.html


问答:


请教机器学习路线
http://www.aboutyun.com/thread-12692-1-1.html

想安装一个hadoop监控Ambari
http://www.aboutyun.com/thread-12693-1-1.html

求助,主类出问题
http://www.aboutyun.com/thread-12701-1-1.html

hbase内存溢出的问题
http://www.aboutyun.com/thread-12704-1-1.html


eclipse 查看源码怎么组织看起来清爽?
http://www.aboutyun.com/thread-12691-1-1.html

如何为django中的按钮绑定事件?
http://www.aboutyun.com/thread-12702-1-1.html








about云2015年04月22日每日一读

每天进步一点点

Python从白板到专家的8个步骤指导,从基础到深度学习及相关资源
http://www.aboutyun.com/thread-12688-1-1.html
1.你是如何从零学习一门新技术的?
2.你认为本文哪些对你有帮助?
3.如何学习Python科学库?



配置hadoop2.x HA必读:HDFS利用QJM实现HA
http://www.aboutyun.com/thread-12687-1-1.html
1.哪个进程可以使备份的节点和活动的节点保持一致?
2.备用的节点可以是否可以监控edit日志的变化?
3.hadoop HA心跳是否发给备用节点?
4.dfs.nameservices是什么?
5.dfs.ha.namenodes.[nameservice ID] 的含义是什么?
6.在每一个nameservice中最多只能有几个NameNode可以被配置?
7.dfs.namenode.rpc-address.[nameservice ID].[name node ID] 配置项的作用是什么?
8.dfs.namenode.shared.edits.dir 配置项的作用是什么?其对应值该如何配置?
9.配置自动故障转移要求添加那两个新的配置,分别在那两个配置文件中?



sqoop 从 hive 导到mysql常遇九问题总结
http://www.aboutyun.com/thread-12684-1-1.html
1.拒绝连接的错误表现是什么?
2.表不存在该如何解决?
3.null字段填充符该如何指定?

NoSQL详解:如何找到对的技术
http://www.aboutyun.com/thread-12672-1-1.html
1、四种主要的NoSQL数据库和它们主要的应用场景?
2、为什么考虑用NoSQL数据库替代传统数据库?
3、NoSQL的优势和劣势?


大数据时代,石化企业应该如何进行数据分析
http://www.aboutyun.com/thread-12673-1-1.html
1、中国企业大数据现状?
2、石化企业数据特征?
3、大数据分析在石化企业的价值?



AWS安全实践2:在任何时候开启MFA令牌
http://www.aboutyun.com/thread-12674-1-1.html
1、什么是MFA?
2、如何才能在AWS上实现MFA?


Spark性能优化的10大问题及其解决方案
http://www.aboutyun.com/thread-12676-1-1.html
1、了解Spark常见性能优化都有那些?
2、如何对Spark性能问题进行解决以及解决的方案都有那些?

Docker Swarm入门(三)Swarm SOA举例
http://www.aboutyun.com/thread-12677-1-1.html
1、如何理解Docker Swarm的SOA架构及其基本的属性?
2、了解SOA架构的相关的层次有哪些?
3、如何理解各层级的作用?



资源:


OpenStack 架构设计指南 当前最新 (2015-04-21)
http://www.aboutyun.com/thread-12671-1-1.html

Red Hat OpenStack认证
http://www.aboutyun.com/thread-12670-1-1.html

[智能Web算法].(玛若曼尼斯).阿稳等.扫描版
http://www.aboutyun.com/thread-12689-1-1.html


问答:


kafka问题请教,拜谢!!
http://www.aboutyun.com/thread-12665-1-1.html


CDH的kerberos配置
http://www.aboutyun.com/thread-12666-1-1.html


有关Hadoop管理调度图形界面有没有开源项目可以参考?
http://www.aboutyun.com/thread-12667-1-1.html


向Hbase里写数据遇到奇怪的问题,Google后也没解决,求助!
http://www.aboutyun.com/thread-12675-1-1.html


求助关于JournalNode超时在哪里设置
http://www.aboutyun.com/thread-12678-1-1.html


hbase一些默认设置,以及参考
http://www.aboutyun.com/thread-12679-1-1.html








about云2015年04月21日每日一读

每天进步一点点




三个应用案例——通过大数据挖掘潜在的威胁
http://www.aboutyun.com/thread-12661-1-1.html
大数据是什么?我们可以有多种说法,不同角度也有不同的解释。大数据典型技术hadoop,还有包括后面的storm、spark等这些生态系统技术。其实这些都是微观,作为一个大数据爱好者,你是否知道大数据的意义。
大数据意味着规律
如果你想比较准确的知道什么,你想预测什么?那么大数据是很好的帮手。
大数据可以帮助企业了解客户
大数据可以帮助预测恐怖分子把某些细菌当作武器
可以预知犯罪
可以根据一个人的行为预测其想干什么


Cinder 调试 - cinder service 状态为 down
http://www.aboutyun.com/thread-12656-1-1.html
1、service 的 up/down 状态取决于什么?
2、Cinder Service 的 update_at 值更新机制是什么?


Spark SQL之External DataSource外部数据源(一)示例
http://www.aboutyun.com/thread-12657-1-1.html
1、创建外部数据源表的语句是?
2、DDL如何创建外部数据源表jsonTable?
3、使用Spark SQL如何执行查询?



Spark SQL之External DataSource外部数据源(二)源码分析
http://www.aboutyun.com/thread-12660-1-1.html
1、注册外部数据源的表的流程是什么?
2、Spark SQL解析SQL流程是什么?
3、我们所支持4种BaseRelation分别是?


OpenStack 并购潮何时来临
http://www.aboutyun.com/thread-12662-1-1.html


问答:
mahout能够处理音频、视频数据吗?
http://www.aboutyun.com/thread-12650-1-1.html

求问,是不是用cloudera-quickstart,就省去了部署hadoop相关的步骤?
http://www.aboutyun.com/thread-12651-1-1.html

实时项目数据落地落到哪合适啊
http://www.aboutyun.com/thread-12652-1-1.html

Hadoop2.6版本在HA集群中启动时:master主节点ResourceManager启动报错
http://www.aboutyun.com/thread-12653-1-1.html

请教个storm问题,拜谢
http://www.aboutyun.com/thread-12654-1-1.html


为什么运行nova list 很慢?
http://www.aboutyun.com/thread-12655-1-1.html


云计算的iaas层目前有哪些科研热点领域和所碰到的难题
http://www.aboutyun.com/thread-12658-1-1.html

hbase入库问题
http://www.aboutyun.com/thread-12659-1-1.html






about云2015年04月20日每日一读

每天进步一点点


全球抢破头 大数据人才荒!
http://www.aboutyun.com/thread-12646-1-1.html

Storm官方文档翻译(2) ——消息处理保证
http://www.aboutyun.com/thread-12647-1-1.html
1.Storm通过调用Spout的什么方法来从spout中请求一个元组?
2.spout通过什么方法发射一个元组到其中某个输出流?
3.如果Storm检测到元组被完全处理了,成功和失败分别是如何处理的?
4.一个未带消息id的原词,storm能否知道其失败还是成功?
5.如何对storm可靠性调优?






一步一步学lucene——(第四步:搜索篇)
http://www.aboutyun.com/thread-12645-1-1.html
1、lucene搜索分页有哪两种方式?
2、不做缓存如何查询数据?
3、lucene的主要API有哪些?



一步一步学lucene——(第三步:索引篇)
http://www.aboutyun.com/thread-12644-1-1.html
1、构建索引的过程是怎样的?
2、lucene与关系型数据库它们俩从索引和模糊查询方面,两者的区别是什么?
3、什么是倒排索引?


一步一步学lucene——(第二步:示例篇)
http://www.aboutyun.com/thread-12643-1-1.html
1、如何使用lucene对硬盘上的文件建立索引?
2、如何在索引文件中查询一个词?
3、索引过程中的几个核心类是?它们的作用是?




Redis 3.0中文官方文档翻译计划(16) ——集群(中)
http://www.aboutyun.com/thread-12640-1-1.html
1、怎么使用redis-rb-cluster写应用?
2、怎么去重新分片集群?
3、怎么去实现测试故障转移?

Redis 3.0中文官方文档翻译计划(15) ——集群(上)
http://www.aboutyun.com/thread-12639-1-1.html
1、怎么去搭建Redis集群?
2、Redis集群的TCP端口是什么?
3、Redis集群的数据分片实现方式?
4、Redis集群的主从模型是怎样的?
6、怎么去保证Redis集群的一致性?
7、怎么去创建集群?
8、怎么去实现与集群共舞?



Redis 3.0中文官方文档翻译计划(14) ——高可用客户端指引
http://www.aboutyun.com/thread-12638-1-1.html
1、怎么去支持Redis Sentinel的Redis客户端指引
2、怎么通过Sentinel去实现Redis服务器?
3、怎么去处理重连?
4、Sentinel遇到故障怎么转移断开?
5、怎么去连接从服务器?
6、怎么去处理连接池?
7、遇到错误时的处理方式?
8、Sentinel列表自动刷新怎么实现?
9、怎么来改进响应能力?
10、怎么去获取额外信息?

Hadoop大数据可以帮助医疗机构5种方法
http://www.aboutyun.com/thread-12636-1-1.html



资源:

分类数据分析的统计统计【第二版】
http://www.aboutyun.com/thread-12648-1-1.html




vsphere vmotion原理
http://www.aboutyun.com/thread-12641-1-1.html

vsphere 性能调优
http://www.aboutyun.com/thread-12642-1-1.html

问答:

SAS R语言 Mahout哪种比较主流?
http://www.aboutyun.com/thread-12637-1-1.html


安装fuse碰到的问题
http://www.aboutyun.com/thread-12630-1-1.html









about云2015年04月19日每日一读

每天进步一点点


Redis 3.0中文官方文档翻译计划(11) ——集中插入
http://www.aboutyun.com/thread-12620-1-1.html
1、怎么使用协议进行集中差异?
2、怎么使用生成Redis协议?
3、管道模式如何工作?

Redis 3.0中文官方文档翻译计划(12) ——高可用(上)
http://www.aboutyun.com/thread-12621-1-1.html
1、分布式有哪些特性?
2、怎么去获取获取Sentinel?
3、怎么去运行运行Sentinel?
4、怎么去 配置Sentinel?
5、怎么去理解和使用仲裁人数?
6、怎么去配置纪元?
7、怎么去配置传播?
8、SDOWN和ODOWN更多细节有哪些?
9、怎么去自动发现和交换信息?

Redis 3.0中文官方文档翻译计划(13) ——高可用(下)
http://www.aboutyun.com/thread-12623-1-1.html
1、怎么去保证分割的一致性?
2、Sentinel的持久化状态有哪几种?
3、Sentinel怎么去配置实例?
4、怎么去从服务器的选举和优先级?
5、怎么实现Sentinel和Redis身份验证?
6、Sentinel API 读取?
7、常用的Sentinel命令有哪些?
8、怎么在运行时重新配置Sentinel?
9、怎么去 添加和删除Sentinel?
10、怎么去删除旧的主服务器或不可达从服务器?
11、怎么去 发布和订阅消息?
12、怎么去了解TILT模式?
13、怎么去处理 处理-BUSY状态?
14、怎么去实现Sentinel客户端?


hadoop登录认证及kerberos认证存在的问题(缺点)
http://www.aboutyun.com/thread-12625-1-1.html
1.hadoop简单模式如何认证?
2.kerberos认证存在什么问题?

微软云和阿里云的区别
http://www.aboutyun.com/thread-12628-1-1.html

资源:


源码解析与开发实战系列视频教程下载
http://www.aboutyun.com/thread-12622-1-1.html


数据分析:企业的贤内助
http://www.aboutyun.com/thread-12627-1-1.html

问答:


关于kafka和zeromq的关系问题
http://www.aboutyun.com/thread-12619-1-1.html


hadoop 通过kerberos进行权限控制
http://www.aboutyun.com/thread-12624-1-1.html

有人用OVS做过限制实例带宽吗?求指导
http://www.aboutyun.com/thread-12626-1-1.html







about云2015年04月18日每日一读

每天进步一点点


大数据时代的商业智能
http://www.aboutyun.com/thread-12614-1-1.html
1.数据挖掘有多种方式定义,知识发现是其中一个含义,知识发现包含哪些流程?
2.数据仓库有哪些特征?
3.操作数据库系统和数据仓库系统的区别是什么?
4.为什么需要分离的数据仓库?

订单贡献率10%,京东个性化推荐系统持续优化的奥秘
http://www.aboutyun.com/thread-12615-1-1.html
1.京东推荐系统三部曲是什么?
2.京东的推荐系统包含哪些架构?
3.京东推荐系统的主要有哪些经验?


Hadoop多用户的配置(Hadoop 2.x)【集群共享给多用户】
http://www.aboutyun.com/thread-12604-1-1.html
1.集群共享给多用户有什么好处?
2.如何将hadoop集群共享给多用户?
3.客户端向集群提交任务时,需要做哪些工作?

把Nutch爬虫部署到Hadoop集群上
http://www.aboutyun.com/thread-12605-1-1.html
1.如何把Nutch爬虫部署到Hadoop集群上?
2.hadoop与nutch的结合点在什么地方?
3.修改Nutch的配置文件该如何修改?
4.如何向Hadoop集群提交Job,进行抓取?



Nutch Crawler抓取数据并存储到MySQL
http://www.aboutyun.com/thread-12603-1-1.html
1.Apache Nutch使用什么语言开发的?
2.为什么要将对应版本Nutch下的插件复制到我们的项目中来?
3.如何建立种子文件?

在Eclipse里运行Nutch
http://www.aboutyun.com/thread-12607-1-1.html
1.如何实现在Eclipse里运行Nutch?
2.nutch-site.xml配置文件,该如何修改?
3.如何生成生成Eclipse项目文件?
4.如何在Eclipse里运行org.apache.nutch.crawl.Crawl来抓取网页?



hbase的行锁与多版本并发控制(MVCC)
http://www.aboutyun.com/thread-12609-1-1.html
1.HBase系统本身只能保证单行的ACID特性,ACID的含义是什么?
2.hbase是如何保证高效的并发读写的?
3.hbase如何实现写同步?
4.MVCC算法下写操作的执行包含哪些流程?


Spark与Hadoop计算模型的比较分析
http://www.aboutyun.com/thread-12611-1-1.html
1、如何理解Spark与Hadoop有什么不同点?
2、Spark与Hadoop的性能和通用性如何?

一步一步学lucene——(第一步:概念篇)
http://www.aboutyun.com/thread-12612-1-1.html
1、理解lucene中信息检索的概念是什么?
2、什么是lucene、以及lucene的作用?
3、如何理解lucene与应用程序的关系?
4、了解lucene的组件都有那些?

使用Python操作Redis
http://www.aboutyun.com/thread-12613-1-1.html
1.python的redis是否实现select命令?
2.本文介绍了哪些Redis使用场景?
3.如何实现使用hash类型保存多样化对象?





资源:

《生存数据分析的统计方法》书籍【600页】
http://www.aboutyun.com/thread-12600-1-1.html


《PYTHON网络编程基础》.(John Goerzen)书籍分享【537页】
http://www.aboutyun.com/thread-12616-1-1.html

用户数据分析方法与案例【180页】
http://www.aboutyun.com/thread-12617-1-1.html

【DNS】在Linux下配置DNS服务
http://www.aboutyun.com/thread-12601-1-1.html

问答:

hbase oldWALs不删除,占用大量空间
http://www.aboutyun.com/thread-12598-1-1.html

社区检测算法有人了解吗?
http://www.aboutyun.com/thread-12599-1-1.html

[经验]STORM设置超时设置太长带来的一个问题
http://www.aboutyun.com/thread-12606-1-1.html

Hbase HMaster启动问题
http://www.aboutyun.com/thread-12608-1-1.html







about云2015年04月17日每日一读

每天进步一点点

基于lucene的案例开发21:纵横小说阅读页采集
http://www.aboutyun.com/thread-12593-1-1.html
1、阅读页的信息如何采集?
2、如果鼠标右键无法查看网页源代码,还有其他方式查看么?


基于lucene的案例开发20:纵横小说章节列表采集
http://www.aboutyun.com/thread-12592-1-1.html
1、如果查看网页源代码时,发现页面已经把鼠标右键操作屏蔽了,还有另外方法查看吗?
2、如何采集章节列表页信息?


HBase 权限控制配置及如何实现授权及收回权限
http://www.aboutyun.com/thread-12591-1-1.html
1.HBase的权限管理需要配置哪些配置文件?
2.HBase提供的安全管控级别包括哪些?
3.使用哪个命令可实现在HBase中赋值权限?
4.如何收回权限?

Storm实战常见问题及解决方案
http://www.aboutyun.com/thread-12590-1-1.html
1.storm集群的环境变量jdk配置应注意什么问题?
2.Storm 为了保证tuple 的可靠处理,需要保存tuple 信息,这样会不会导致内存泄漏?
3.Storm如何处理重复的tuple问题?
4.关于task与executor的关系问题?

资源:

一大波资料来袭--互联网大会资料--002
http://www.aboutyun.com/thread-12588-1-1.html

问答:

请问一下是否有遇到过所有的bolt都发送ack,但是SPOUT确认为失败的情况?
http://www.aboutyun.com/thread-12589-1-1.html

有没有关于Storm UI界面参数字段 的说明?
http://www.aboutyun.com/thread-12594-1-1.html

storm ui显示supervisor个数与实际不符的解决
http://www.aboutyun.com/thread-12595-1-1.html








about云2015年04月16日每日一读

每天进步一点点

Spark 2.0:将支持在手机(移动)设备上运行Spark
http://www.aboutyun.com/thread-12582-1-1.html
1.Spark将支持在哪些移动设备上运行?
2.目前Android Runtime (ART) 目前支持用什么语言编写的应用程序?
3.为移动平台扩展TaskContext,TaskContext需要考虑哪些问题?


电商数据挖掘之关联算法介绍
http://www.aboutyun.com/thread-12576-1-1.html
什么是支持度、置信度?
数据关联是什么?
关联本文分为哪些种类?
什么是强关联规则?



测试你是否真的适合在数据科学领域工作
http://www.aboutyun.com/thread-12570-1-1.html
1.在数据科学领域工作意味着什么?
2.本文认为数据科学家必备哪些素质?

健康大数据分析方法:关联规则算法
http://www.aboutyun.com/thread-12573-1-1.html
1.不同支持度和置信度的并发组合模式分为几种?
2.什么是应用负模式规则?
3.什么是应用零模式?

如何速成数据分析师
http://www.aboutyun.com/thread-12574-1-1.html
1.如何速成数据分析师?
2.本文讲了成为数据分析师需要哪些技能?
3.你认为那些技能比较重要?

Azure机器学习平台的扩展和R编程
http://www.aboutyun.com/thread-12575-1-1.html
1.Azure机器学习是项基于云的多租户可扩展服务,它可以用来做什么?
2.在搭建Azure机器学习平台的基础时,需要注意哪些问题?
3.数据科学家可使用ggplot2来完成什么任务?


基于lucene的案例开发17:查询语句创建PackQuery
http://www.aboutyun.com/thread-12567-1-1.html
1、如何进行通配符检索?
2、如何定义范围搜索?
3、PackQuery类的构造方法,最好是手动指定分词器还是使用索引的分词器?为什么?



基于lucene的案例开发18:纵横小说更新列表页抓取
http://www.aboutyun.com/thread-12568-1-1.html
1、CrawlListPageBase类功能是什么?
2、用HttpClient 模拟浏览器的行为,如何对请求做伪装?
3、获取页面内我们需要的链接?


基于lucene的案例开发19:纵横小说简介页采集
http://www.aboutyun.com/thread-12569-1-1.html
1、如何采集简介页内容?
2、采集时,如何获取标签和字数字段?
3、如何对获取的html代码做进一步处理?



新手快速获取积分方法
http://www.aboutyun.com/thread-12577-1-1.html

资源帖发帖说明
http://www.aboutyun.com/thread-12581-1-1.html


资源:
数据挖掘导论 完整版【485页】
http://www.aboutyun.com/thread-12584-1-1.html

源码解析与开发实战系列视频教程
http://www.aboutyun.com/thread-12566-1-1.html


一大波资料来袭--互联网大会ppt--001
http://www.aboutyun.com/thread-12580-1-1.html

问答:

基于Hbase的海量视频存储
http://www.aboutyun.com/thread-12583-1-1.html

求大神支招!CDH怎么与企业ERP结合!!!
http://www.aboutyun.com/thread-12571-1-1.html

【请教】storm中最后的一个bolt是否还需要emit?
http://www.aboutyun.com/thread-12572-1-1.html








about云2015年04月15日每日一读

每天进步一点点


Hortonworks 收购 SequenceIQ ,实现快速部署Hadoop集群
http://www.aboutyun.com/thread-12559-1-1.html

分布式爬虫技术架构
http://www.aboutyun.com/thread-12550-1-1.html
1.什么是Spiderman?
2.webmagic有什么功能?
3.分布式爬虫包含哪些技术架构?


基于lucene的案例开发14:实时索引管理类IndexManager
http://www.aboutyun.com/thread-12551-1-1.html
1、如何利用lucene来实现索引的管理?
2、如何实现索引的单例模式?
3、内存重读线程的配置参数如何配置?


基于lucene的案例开发15:实时索引的检索
http://www.aboutyun.com/thread-12552-1-1.html
1、检索结果的数据结构是怎样的?
2、如何利用实时索引去检索数据?
3、利用NRTSearch类如何实现一系列的查询操作:如,关键字检索,分类检索等?


基于lucene的案例开发16:实时索引的修改
http://www.aboutyun.com/thread-12553-1-1.html
1、实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来操作的?
2、TrackingIndexWriter中的方法和IndexWriter中的方法类似,都实现了索引的基本操作?
3、 TrackingIndexWriter类中的增删改操作语句是怎样的?


Redis与Memcached异同一
http://www.aboutyun.com/thread-12546-1-1.html
1.Redis是什么?
2.Redis是多线程还是单线程?
3.Redis有什么用?

Redis与Memcached异同二
http://www.aboutyun.com/thread-12547-1-1.html
1.Redis与Memcached各自都有自己的那些优势和劣势?
2.Redis和Memcached内存管理机制有哪些不同?
3.Redis和Memcached集群管理有哪些不同?

Redis与Memcache异同三:Redis是新兴的通用存储系统,而Memcached仍有其适用领域
http://www.aboutyun.com/thread-12548-1-1.html
1.Redis与Memcache共同特征是什么?
2.Memcached 适用场景是什么?
3.Redis 有哪些使用场景?
4.用Memcached更新一个对象需要干什么?

hive权限控制介绍
http://www.aboutyun.com/thread-12549-1-1.html
1.hive权限控制需要配置那个配置文件?
2.Hive授权的核心是什么?
3.如何实现 角色的授权和撤销?



Python编程—实现简单爬虫功能
http://www.aboutyun.com/thread-12543-1-1.html
1、如何下载贴吧或空间中所有图片?
2、如何了解Python中urllib包及API?
2、如何理解Python中文件与目录操作?

基于OpenFlow架构的IaaS云安全
http://www.aboutyun.com/thread-12544-1-1.html
1.IaaS有哪些优势?
2.IaaS模型的核心是什么?
3.什么是SDN?

Redis入门
http://www.aboutyun.com/thread-12545-1-1.html
1.什么是Redis?
2.Redis支持哪些数据类型?
3.如何使用Jedis操作Redis?

Python—Python的内存管理
http://www.aboutyun.com/thread-12554-1-1.html
1、如何理解Python的内存管理?
2、如何理解Python的内存管理方式都有那些方式?

Ubuntu14.04设置网络代理【为什么ping不同域名】
http://www.aboutyun.com/thread-12555-1-1.html
1.如何设置代理?
2.设置代理有几种方式?
3.ping不通域名,可能原因是什么?

memcache 源代码分析 - 数据结构篇(上)
http://www.aboutyun.com/thread-12558-1-1.html
1.memcache 主进程与工作进程之间如何通信?
2.connection 代表的是什么?


资源:

数据挖掘原理与算法【334页】
http://www.aboutyun.com/thread-12561-1-1.html

打造支撑海量用户的高性能server1
http://www.aboutyun.com/thread-12539-1-1.html

mapreduce海量数据并行处理:数据挖掘基础算法
http://www.aboutyun.com/thread-12564-1-1.html;

问答:


web调用hdfs出现找不到Configuration这个类
http://www.aboutyun.com/thread-12560-1-1.html

请教问题关于判断三个节点之间关系类型的问题
http://www.aboutyun.com/thread-12562-1-1.html

这样的topology在代码中应该怎么写啊
http://www.aboutyun.com/thread-12563-1-1.html

问个问题,我用vmware配置了3个host-only的模式,ping不同
http://www.aboutyun.com/thread-12542-1-1.html

java.nio.channels.ClosedChannelException
http://www.aboutyun.com/thread-12557-1-1.html









about云2015年04月14日每日一读

每天进步一点点


IBM测试机器人新算法:完全再现人脑已成为可能
http://www.aboutyun.com/thread-12533-1-1.html


Nutch 快速入门(Nutch 2.2.1)
http://www.aboutyun.com/thread-12527-1-1.html
1.如何配置nutch存储数据到hbase?
2.如何过滤种子URL?
3.如何将Nutch与Solr集成在一起?

基于lucene的案例开发12:数据库连接池
http://www.aboutyun.com/thread-12529-1-1.html
1、数据库连接池技术的核心思想是什么?
2、如何实现数据库连接池?
3、DBPool类配置文件参数都有哪些,作用是什么?


基于lucene的案例开发13:实现实时索引基本原理
http://www.aboutyun.com/thread-12530-1-1.html
1、实时索引基本原理是什么?
2、ConfigBean类都定义了索引的哪些基本属性?
3、在lucene系统刚启动时候,存在哪两个索引?


关于AWS CLI:十个你不知道的实用命令
http://www.aboutyun.com/thread-12532-1-1.html
1.如何只通过一条命令就可以删除指定的S3 bucket和其中的所有内容?
2.aws ec2 describe-images | grep ubuntu命令作用是什么?
3.哪个命令实现显示一个S3 bucket和其储存项目的大小?


Windows7环境下MyEclipse+Nutch2.2.1+Mysql搭建
http://www.aboutyun.com/thread-12534-1-1.html
1.Windows7环境下MyEclipse+Nutch2.2.1+Mysql搭建包含哪些步骤?
2.如何从eclipse中下载nutch?
3.如何解决eclipse编码问题?

在mac中导入hadoop2.6.0源代码至eclipse
http://www.aboutyun.com/thread-12535-1-1.html


资源:

大数据旅游应用
http://www.aboutyun.com/thread-12536-1-1.html

美妙统计数据谎言
http://www.aboutyun.com/thread-12537-1-1.html


问答:


kafka问题求助-----!!!
http://www.aboutyun.com/thread-12524-1-1.html


Hbase启动出现的很怪异的问题???? 折磨了一天了,求教!!!
http://www.aboutyun.com/thread-12525-1-1.html

Nutch2.2.1+Mysql 怎么定制抓取数据规则,而不是将整个页面趴下了,保存到数据库
http://www.aboutyun.com/thread-12526-1-1.html

controller控制节点重启nova相关服务启动失败
http://www.aboutyun.com/thread-12528-1-1.html







about云2015年04月13日每日一读

每天进步一点点

about云2015年04月第二周经典回顾
http://www.aboutyun.com/thread-12506-1-1.html

Redis 3.0中文官方文档翻译计划(10) ——持久化
http://www.aboutyun.com/thread-12507-1-1.html
1、Redis怎么来持久化?
2、RDB有哪些优点和缺点?
3、AOF有哪些优点和缺点?
4、RDB和AOF改如何选择呢?
5、快照是什么?
6、Redis持久化是怎么工作的?
7、AOF持久性如何?
8、AOF损坏了怎么办?
9、如何从RDB切换到AOF?
10、AOF和RDB的相互作用?
11、怎么去处理备份数据和灾难恢复?

Redis 3.0中文官方文档翻译计划(9) ——复制
http://www.aboutyun.com/thread-12505-1-1.html
1、Redis主服务器关闭持久化时的安全性是怎么处理的?
2、Redis复制如何工作?
3、Redis如何处理部分重同步?
4、无盘复制的原理是什么样的?
5、Redis怎么去配置复制?
6、怎么去配置只读从服务器以及认证主服务器配置?


Redis 3.0中文官方文档翻译计划(8) ——分片
http://www.aboutyun.com/thread-12504-1-1.html
1、分片为何有用?
2、分片基础是什么?
3、分片有哪些实现方式?
4、分片有哪些缺点?
5、Redis分片作为数据存储还是缓存呢?
6、预分片是怎样实现的?
7、Redis集群和分片之间的关联是什么?
8、Twemproxy怎么用来集群分片?

基于lucene的案例开发10:搜索后台基础,JsonUtil & XmlUtil类介绍
http://www.aboutyun.com/thread-12511-1-1.html
1.什么是json?
2.给定java对象如何实现生成对应json?
3.如何实现将java对象转化为xml格式的字符串?

基于lucene的案例开发11:项目常用类ClassUtil & CharsetUtil介绍
http://www.aboutyun.com/thread-12512-1-1.html
1.ClassUtil类中的方法的作用是什么?
2.CharsetUtil类工具类用途是什么?
3.如何使用第三方jar包检测文件的编码?


docker存储结构解析
http://www.aboutyun.com/thread-12513-1-1.html
1、创建一个apache容器时devicemapper处理流程是什么?
2.docker服务在启动的时候可以配置devicemapper的启动有哪些参数?
3.docker服务在启动的时候如何配置devicemapper的启动参数?


docker底层实现概览
http://www.aboutyun.com/thread-12514-1-1.html
1.为什么要使用docker?
2.Docker使用了什么等命名空间来隔离网络、文件系统、进程等资源?
3.什么机制实现了对资源的配额和度量?
4.如何配置cgroups?

人工神经网络正在学习记忆
http://www.aboutyun.com/thread-12515-1-1.html
1.人工神经网络的难题是什么?
2.人工神经网络的起源自什么?

PAAS平台的web应用性能测试与分析
http://www.aboutyun.com/thread-12516-1-1.html
1.出现访问自己web应用慢,本文分析可能几个原因?
2.PAAS平台的web应用性能,如何定位具体原因?


资源:

数据挖掘DATA MINING【英文文档】
http://www.aboutyun.com/thread-12518-1-1.html

机器学习书籍(A Probabilistic Perspective)【1098页】
http://www.aboutyun.com/thread-12519-1-1.html

问答:

关于调试
http://www.aboutyun.com/thread-12502-1-1.html


hbase 删除表后空间煤没有得到释放
http://www.aboutyun.com/thread-12503-1-1.html

hbase 删除表后空间煤没有得到释放
http://www.aboutyun.com/thread-12503-1-1.html

storm遇到的一个奇怪问题,求教!!
http://www.aboutyun.com/thread-12508-1-1.html

storm处理一比交易的耗时报错
http://www.aboutyun.com/thread-12509-1-1.html

openstack-juno搭到一半,重启了机器,然后网络节点就断网了
http://www.aboutyun.com/thread-12510-1-1.html






about云2015年04月12日每日一读

每天进步一点点

about云openstack零基础部署开发入门购买活动
http://www.aboutyun.com/thread-12487-1-1.html

Spark环境搭建【图文】
http://www.aboutyun.com/thread-12496-1-1.html
1.如何现在安装、配置scala?
2.如何安装scala 插件?
3.创建scala 项目需要哪些步骤?


网站日志挖掘介绍:目的、搜集方式、流程等
http://www.aboutyun.com/thread-12499-1-1.html
1.什么网站日志挖掘的目的是什么?
2.网站分析数据主要有哪三种收集方式?
3.web日志挖掘包含哪些流程?

叫板OpenStack:八步用Docker实现私有云
http://www.aboutyun.com/thread-12491-1-1.html
1、如何通过Docker实现自己的私有云?
2、如何安装Docker?
3、如何搭建自己的私有仓库?


如何在openstack中创建镜像 for Juno
http://www.aboutyun.com/thread-12492-1-1.html
1.利用Horizon和ISO格式的安装盘来创建镜像的方法原理是什么?
2.创建磁盘是如何实现的?
3.将磁盘配置写入XML文件中是如何实现的?

Redis 3.0中文官方文档翻译计划(5) ——使用Redis实现Twitter(上)
http://www.aboutyun.com/thread-12493-1-1.html
1、怎么去设计数据库?
2、粉丝关注和帖子之间的关联是怎么样的?
3、怎么去做身份验证处理?

Redis 3.0中文官方文档翻译计划(6) ——使用Redis实现Twitter(下)
http://www.aboutyun.com/thread-12494-1-1.html
1、帖子的更新是怎么设计的?
2、帖子分页是怎么处理的?
3、如何创建关注/粉丝关系?
4、怎么去伸缩处理高并非?

Redis 3.0中文官方文档翻译计划(7) ——使用Redis作为LRU缓存
http://www.aboutyun.com/thread-12495-1-1.html
1、怎么去配置maxmemory配置指令?
2、Redis的回收策略是怎样的?
3、Redis的回收过程是怎么样的?
4、怎么去认识LRU算法?

资源:
Python基础教程
http://www.aboutyun.com/thread-12500-1-1.html

问答:

2.6新特性“基于标签的调度机制”:有什么真实场景在用吗?
http://www.aboutyun.com/thread-12486-1-1.html

A master URL must be set in your configuration错误
http://www.aboutyun.com/thread-12489-1-1.html

scala ActorSyetem异常
http://www.aboutyun.com/thread-12490-1-1.html

史上最全版支付宝之所以厉害的原因:来看内部架构剖析
http://www.aboutyun.com/thread-12488-1-1.html

【HDFS】新手用Java读取HDFS并输出
http://www.aboutyun.com/thread-12498-1-1.html









about云2015年04月11日每日一读

每天进步一点点


处理960亿张照片需要怎样的技术架构支撑?
http://www.aboutyun.com/thread-12483-1-1.html
1.Camera360为什么对云服务需求如此之大?
2.他们对云服务有哪些期望?
3.每一个要使用云计算的客户最担心什么问题?




如何设计伟大的数据产品
http://www.aboutyun.com/thread-12476-1-1.html
1.我们正在进入数据驱动的时代,为什么这么说?
2.模型装配线:最优决策组本文讲了什么案例?
3.你对推荐系统中的传动系统方法了解多少?本文对它是如何诠释的?


spark SQL编程
http://www.aboutyun.com/thread-12473-1-1.html
1.sparkSQL中核心的组件是什么?
2.SchemaRDD组成都包含什么?
3.sparkSQL是否支持多种数据源?
4.spark SQL支持hive哪些功能,不支持哪些功能?

金山在openstack使用(实战)中遇到的问题
http://www.aboutyun.com/thread-12480-1-1.html
1.OpenStack给金山带来了哪些好处?
2.作者认为OpenStack技术最适用于哪些应用场景?
3.企业如果想快速应用OpenStack应该如何去做?
4.金山在应用OpenStack技术时遇到了哪些问题?是如何解决的?

百度使用spark工程实践【马小龙】
http://www.aboutyun.com/thread-12482-1-1.html
1.百度是如何使用spark的?
2.百度使用spark遇到了什么问题?
3.百度使用spark带来了什么效果?
4.马小龙认为spark的适用场景是什么?


Puppet(hadoop集群)使用方法总结
http://www.aboutyun.com/thread-12471-1-1.html
1、如何理解puppet概述和设计架构?
2、如何安装puppet、以及puppet的目录结构、和验证puppet是否安装成功?
3、理解puppet中manifest的编写方法:资源属性,资源,节点管理,函数和模块的编写方法都有什么?
4、安装Puppet可能会遇见的问题?

pdsh-让集群管理更轻松自如
http://www.aboutyun.com/thread-12469-1-1.html
1、如何理解pdsh集群和运行原理?
2、如何理解pdsh集群命令的基本用法?
3、pdsh集群如何安装以及下载地址?

七种基于云计算的机器学习平台介绍
http://www.aboutyun.com/thread-12477-1-1.html
1.云计算的机器学习有哪些云平台?
2.Google Prediction API提供模式匹配和机器学习功能,创建一个应用,能够执行哪些任务?
3.亚马逊在机器学习方面,提供了哪些便利?

基于lucene的案例开发9:案例初识
http://www.aboutyun.com/thread-12479-1-1.html
1.本案例的架构是什么?
2.搜索后台使用什么技术?
3.爬虫的作用是什么?



资源:


storm集群的搭建
http://www.aboutyun.com/thread-12474-1-1.html

社交网站的数据挖掘与分析【315页】
http://www.aboutyun.com/thread-12484-1-1.html



问答:

为什么在spark1.0.0_cdh5.1.3中启用找不到SparkSQL?
http://www.aboutyun.com/thread-12467-1-1.html


为何set mapred.reduce.tasks=5没生效?
http://www.aboutyun.com/thread-12468-1-1.html


【闲言闲语】《师说》译文--如何从师?
http://www.aboutyun.com/thread-12470-1-1.html

个奇怪的hive执行现象,复杂的SQL仅仅在一台机器上执行
http://www.aboutyun.com/thread-12475-1-1.html

hadoop 2.2 在集群运行正常的情况下,添加节点
http://www.aboutyun.com/thread-12478-1-1.html






about云2015年04月10日每日一读

每天进步一点点

靠大数据赚钱的10个参考案例
http://www.aboutyun.com/thread-12463-1-1.html
很多人认为大数据是在炒作,那么大数据是否能够创造社会价值,能够真正影响我们的生活,能否真正让公司赚钱。



数据挖掘入门1:什么是数据挖掘
http://www.aboutyun.com/thread-12457-1-1.html
1.什么是数据挖掘?
2.为什么会产生数据挖掘?
3.从海量数据中找到有价值的数据,价值包括几类?
4.数据挖掘有几种展现形式?



数据挖掘入门2:什么是数据挖掘
http://www.aboutyun.com/thread-12458-1-1.html
1.什么是数据仓库?
2.数据仓库对企业的作用和意义是什么?
3.OLAP的多维分析操作包括什么?
4.数据挖掘解决哪四大类问题?

OpenStack 创建快照(Create Snapshot)过程源码分析
http://www.aboutyun.com/thread-12450-1-1.html
1.nova/compute/api.py完成了什么功能?
2.OpenStack环境中会有很多个nova-compute,需要通过哪个函数来获取虚拟机所在的host?
3.哪个文件中实现判断虚拟机的后端存储是什么,不同的后端存储做不同的snapshot?


OpenStack虚拟机创建过程中镜像格式的的变化过程
http://www.aboutyun.com/thread-12449-1-1.html
1.如何查看镜像的大小?
2.通过哪个日志,可以查看vm的创建过程?
3.创建虚拟机的过程中,openstack的image文件的类型如果是qcow2,则转换为什么格式?


HBase的数据的update,是如何保证获取最新数据的
http://www.aboutyun.com/thread-12452-1-1.html
1.hbase威慑么是三维度表?
2.hbase如何区别是否是同一条记录?
3.hbase是如何保证获取的是最新数据的?


OpenStack故障诊断
http://www.aboutyun.com/thread-12455-1-1.html
1、OpenStack如何检查服务?
2、OpenStack报错解决的常见手法?

将 Ceph 存储集群集成到 OpenStack 云中
http://www.aboutyun.com/thread-12456-1-1.html
1.Ceph 生态系统可分解为哪5部分?
2.OSD是什么进程?它的作用是什么?
3.CRUSH 算法在Ceph中发挥什么作用?


基于lucene的案例开发:IndexSearcher中检索方法
http://www.aboutyun.com/thread-12460-1-1.html
1.在lucene中哪一个类用来对搜索结果做收集、自定义排序、过滤等?
2.哪一个类是做筛选条件的,用于指定哪些文档可以在搜索结果中?
3.Sort类的作用是什么?


程序员发展之一:产品经理如何入门
http://www.aboutyun.com/thread-12461-1-1.html
1.产品经理的要求是什么?
2.该如何成为产品经理?
3.产品经理需要哪些素质?


大数据时代,企业该如何调整抓住发展机遇
http://www.aboutyun.com/thread-12462-1-1.html

AWS安全实践:禁用root API访问密钥
http://www.aboutyun.com/thread-12464-1-1.html
1.root用户在aws中是否重要?
2.在禁用AWS访问密钥之前,你还需要哪些准备工作?




资源:

Mahout机器学习平台
http://www.aboutyun.com/thread-12465-1-1.html


炼数-数据分析与SPSS(完整)共12周
http://www.aboutyun.com/thread-12448-1-1.html


问答:

hbase协处理器,怎么判断是否是更新
http://www.aboutyun.com/thread-12451-1-1.html

求助:各位大神----storm问题
http://www.aboutyun.com/thread-12459-1-1.html










about云2015年04月09日每日一读

每天进步一点点

文件并发(日志处理)--队列--Redis+Log4Net
http://www.aboutyun.com/thread-12442-1-1.html
1.redis都有哪些数据类型?
2.什么是Memcached,和redis有什么不同?
3.Redis有哪两种存储方式?


人脸识别技术大总结1——Face Detection & Alignment
http://www.aboutyun.com/thread-12441-1-1.html
1.特征提取本文采用了哪三种方法?
2.用opencv分类器,参数设成99%的recall率将会带来很严重的效率灾难,该如何解决?
3.什么是随机森林?


英国制药公司联手挖掘基因数据(图)
http://www.aboutyun.com/thread-12440-1-1.html

基于lucene的案例开发7:Query查询
http://www.aboutyun.com/thread-12443-1-1.html
1.Query子类有哪些?
2.QueryParser与MultiFieldQueryParser有什么不同?
3.哪个类用于通配符搜索?
4.如何实现基于lucene的Query查询?



资源:

虚拟化与云技术、虚拟化桌面技术视频【限时下载】
http://www.aboutyun.com/thread-12446-1-1.html


问答:

hive分布式复杂语句报错
http://www.aboutyun.com/thread-12436-1-1.html

OpenStack+Docker可以不用nova吗?
http://www.aboutyun.com/thread-12437-1-1.html

求CDH开发hadoop MR程序的 的eclipse插件
http://www.aboutyun.com/thread-12438-1-1.html

cdh5 只有一台nodemanager跑作业,求高手
http://www.aboutyun.com/thread-12439-1-1.html

【吐槽】终于成功运行hello world 了
http://www.aboutyun.com/thread-12444-1-1.html

机器学习——深度学习(Deep Learning)
http://www.aboutyun.com/thread-12445-1-1.html










about云2015年04月08日每日一读

每天进步一点点


千台Spark集群对千亿量级节点的相似度计算
http://www.aboutyun.com/thread-12427-1-1.html
1.相似度计算出现在什么领域中?
2.对于本文提出的问题mapreduce的解决方案是什么?
3.对于本文提出的问题spark的解决方案是什么?





支撑过万亿音乐事件的数据系统分析
http://www.aboutyun.com/thread-12429-1-1.html
1.Moneyball for Music集群规模是怎么样的?
2.在Hadoop基础设施方面面临哪些问题?
3.Moneyball for Music都是用了哪些技术?


CDH安装中的一些问题及解决方法
http://www.aboutyun.com/thread-12431-1-1.html
1.yarn无法启动,可能原因是什么?
2.Host Monitor和Service Monitor服务无法启动,可能造成的原因是什么?
3.oozie服务启动失败本文是如何解决的?

基于lucene的案例开发6:分词器介绍
http://www.aboutyun.com/thread-12432-1-1.html
1.StandardAnalyzer有什么优点和缺点?
2.基于Lucene的第三方中文分词是什么技术?
3.IKAnalyzer分词技术有什么缺点?
4.你使用过哪些分词技术?


Spark技术内幕:Storage 模块整体架构
http://www.aboutyun.com/thread-12421-1-1.html
1、如何理解Spark模块整体架构?
2、理解Spark中各个类的功能作用都有什么?

Spark技术内幕:Shuffle的性能调优
http://www.aboutyun.com/thread-12422-1-1.html
1、了解Spark的Shuffle性能调优的参数都有那些?
2、如何理解Shuffle性能调优各种参数的作用?







python面试题总结
http://www.aboutyun.com/thread-12428-1-1.html

问答:

hbase的regionserver崩了。。
http://www.aboutyun.com/thread-12433-1-1.html

shuffle与sort
http://www.aboutyun.com/thread-12414-1-1.html


cdh hive任务出现异常
http://www.aboutyun.com/thread-12415-1-1.html

redis 键的设计,以及效率问题
http://www.aboutyun.com/thread-12417-1-1.html

hyeper-v是否支持iintel-vt选项
http://www.aboutyun.com/thread-12418-1-1.html

程序在Hadoop的集群环境下运行报错:ExitCodeException exitCode
http://www.aboutyun.com/thread-12419-1-1.html

python-keystone-auth-token 安装不上求解释
http://www.aboutyun.com/thread-12420-1-1.html

在openstack部署了实例,状态总是“ERROR” (三)
http://www.aboutyun.com/thread-12423-1-1.html

clouderaManager出现HostMonitor异常,监控无法展示
http://www.aboutyun.com/thread-12424-1-1.html

[解决后端使用ceph qem性能问题](升级kvm后使用virt-type=kvm(qemu-system-x86_6.
http://www.aboutyun.com/thread-12425-1-1.html









about云2015年04月07日每日一读

每天进步一点点


大数据:数据挖掘 应用七案例
http://www.aboutyun.com/thread-12411-1-1.html
1.出了一个新成品,哪些老客户最可能购买,具体讲了什么案例?
2.如何挖掘电子商务网站公共页面该放哪些内容最可能产生购买行为?
3.如何得到登录网站的当前用户现在最可能购买什么东西?



OpenStack菜鸟级服务检查
http://www.aboutyun.com/thread-12408-1-1.html
1、OpenStack报错,怎么解决?
2、如何对OpenStack的服务进行检查?

OpenStack菜鸟级故障排除
http://www.aboutyun.com/thread-12409-1-1.html
1、你是如何解决OpenStack报错的?
2、谈谈你的方法吧?



基于lucene的案例开发4:创建索引
http://www.aboutyun.com/thread-12399-1-1.html
1.如何指定索引分词技术?
2.如何把文档写到索引中?
3.创建索引过程中,用到了哪些核心类?

基于lucene的案例开发5:搜索索引
http://www.aboutyun.com/thread-12400-1-1.html
1.如何实现搜索索引?
2.如何实现检索索引,获取符合条件的前10条记录 ?
3.那个类用于读取索引?



Scala开发入门指南【精炼】
http://www.aboutyun.com/thread-12401-1-1.html
1.Scala开发使用eclipse如何开发?
2.如何安装Scala的Eclipse插件?
3.如何验证安装?

Scala入门:Scala例子,以及如何与Java交互
http://www.aboutyun.com/thread-12402-1-1.html
1.scala中静态成员如何表示?
2.如何编译scala实例?
3.如何scala实例?
4.import与Java有什么不同
5.下划线(_)代表什么?


Phoenix简介及安装部署使用
http://www.aboutyun.com/thread-12403-1-1.html
1.什么是Phoenix?
2.有了Hive和Impala,为何使用Phoenix?
3.TABLE 跟 VIEW 有什么区别?


阿里巴巴研究员赵海平:从Facebook到阿里巴巴
http://www.aboutyun.com/thread-12405-1-1.html

Hadoop大数据面试--Hadoop篇
http://www.aboutyun.com/thread-12406-1-1.html

BAT三方大比拼:大数据能力哪家强
http://www.aboutyun.com/thread-12410-1-1.html

资源:
数据挖掘、数据分析:R语言15周视频下载【限时下载】
http://www.aboutyun.com/thread-12412-1-1.html



问答:

我在eclipse里面添加spark编译的library后,提示:
http://www.aboutyun.com/thread-12404-1-1.html






about云2015年04月06日每日一读

每天进步一点点

大数据架构师、开发人员、公司必读:国外大数据应用的10个项目案例(图表)
http://www.aboutyun.com/thread-12384-1-1.html
1.大数据如何应用于电力能源项目,带来效益?
2.数据可视化有哪些应用?
3.是否可以将可视化应用于空气污染?
4.大数据如何应用于各种(手机)应用?
5.你认为大数据还可以应用于那些场景?



spark 1.3.0 将dataframe数据写入Hive分区表
http://www.aboutyun.com/thread-12392-1-1.html
1.将DataFrame数据如何写入到Hive表中?
2.通过那个API实现创建spark临时表?
3.如何将DataFrame数据写入hive指定数据表的分区中?

spark1.3.0 on yarn 构建(hive0.12.0)
http://www.aboutyun.com/thread-12393-1-1.html
1.编译spark源文件的过程中,如何防止内存不足?
2.spark如果没有自己hadoop或则hive版本对应的预构建版本,该如何编译?
3.spark需要将hive-site.xml放入spark目录下的conf文件中,不兼容该如何处理?
4.运行spark-sql会报缺少mysql驱动包错误,该如何处理?



zookeeperr3.4.5+tomcat7+solr-4.10.1分布式集群搭建
http://www.aboutyun.com/thread-12394-1-1.html
1.如何安装Zookeeper?
2.tomcat7如何与solr相结合的?
3.如何启用JAVA_OPTS属性?


基于lucene的案例开发2:索引数学模型
http://www.aboutyun.com/thread-12381-1-1.html
1.什么是文档、词元、域?
2.影响一个词元在一篇文档中的重要性主要有哪两个因素?
3.空间向量模型(VSM)可以表达什么?
4.对文档信息的检索,通过什么模型可以转化为求两个向量之间的夹角大小?

基于lucene的案例开发3:索引文件结构
http://www.aboutyun.com/thread-12382-1-1.html
1.lucene索引结构是层次结构,主要有哪几个层次?
2.索引的最小单位是什么?
3.索引(Index)与段什么关系?
4.段什么情况下会合并?
5.write.lock文件有几种?
6.什么是正向信息与反向信息?


Redis 3.0官方文档翻译计划(2) ——从入门到精通(上)
http://www.aboutyun.com/thread-12388-1-1.html
1、Redis键注意事项?
2、Redis的字符串类型创建和获取?
3、Redis过期,有限生存时间的键怎么创建?


Redis 3.0官方文档翻译计划(3) ——从入门到精通(中)
http://www.aboutyun.com/thread-12389-1-1.html
1、Redis列表是怎么使用的?
2、Redis的哈希/散列怎么查找列表?
3、Redis集合怎么使用的?

Redis 3.0官方文档翻译计划(4) ——从入门到精通(下)
http://www.aboutyun.com/thread-12390-1-1.html
1、怎么去使用Redis有序集合?
2、Redis范围操作是怎样的?
3、Redis字典分数怎么操作?
4、 Redis更新分数操作方式有哪些?
5、Redis位图怎么存储?
6、Redis超重对数怎么使用?   


资源:

数据挖掘概念与技术(第三版)
http://www.aboutyun.com/thread-12395-1-1.html

大数据测试实战
http://www.aboutyun.com/thread-12385-1-1.html



大数据应用 ——数据安全和数据分析
http://www.aboutyun.com/thread-12383-1-1.html

问答:

hbase 一会Hregionserver先消失然后Hmaster也消失了
http://www.aboutyun.com/thread-12391-1-1.html

此种海量数据统计如何用HIVE实现?
http://www.aboutyun.com/thread-12380-1-1.html

在启动完hbase以后create table的时候报的错The node /hbase is not in ZooKeeper.
http://www.aboutyun.com/thread-12387-1-1.html









about云2015年04月05日每日一读

每天进步一点点



基于lucene的案例开发1:lucene初始认知
http://www.aboutyun.com/thread-12377-1-1.html
1.什么是结构化数据?
2.什么是非结构化数据?
3.如何对非结构化数据实现索引?
4.如何进行索引检索?





mafka平台架构
http://www.aboutyun.com/thread-12362-1-1.html
1.什么是Mafka?
2.mafka平台里面有哪四个角色?
3.mafka-client有什么特点?


Hive 查询优化总结
http://www.aboutyun.com/thread-12363-1-1.html
1.hive join 如何优化?
2.group by 优化该如何优化?
3.Distinct 该如何使用?

Lucene与HBase的组合使用及HBasene的分析报告
http://www.aboutyun.com/thread-12364-1-1.html
1.Lucene中,以什么的形式作为搜索的主体?
2.Lucene与HBase的组合实现方法是什么?
3.HBase Table的实现有哪两种方式?



利用OpenVSwitch构建多主机Docker网络
http://www.aboutyun.com/thread-12365-1-1.html
1.分别在每台主机上运行Docker,在公网或内网网卡上暴露端口以便容器间相互通讯会带来什么问题?
2.利用OpenVSwitch构建多主机Docker网络,需要注意哪些问题?
3.如何实现利用OpenVSwitch构建多主机Docker网络?


探索 OpenStack 之(10):cinder-api Service 处理 HTTP Request 的过程分析
http://www.aboutyun.com/thread-12369-1-1.html
1、怎么按顺序调用已经注册的 middleware (filter) 实例的 __call__ 方法?
2、怎么调用已注册的 APIRouter 实例的 __call__ 方法?
3、osapi-volume 处理 HTTP Request过程是怎样的


探索 OpenStack 之(11):研究 Keystone
http://www.aboutyun.com/thread-12370-1-1.html
1、Keystone的功能有那些?
2、Keystone的重点有哪些呢?
3、V3 版本 Keystone API是怎么样的呢?

Redis 3.0官方文档翻译计划(1) ——Redis介绍
http://www.aboutyun.com/thread-12371-1-1.html
1、Redis性能高的原因是什么?
2、Redis的数据类型有哪些?

storm源码分析之topology提交过程
http://www.aboutyun.com/thread-12372-1-1.html
1.topology的jar包是 如何上传到nimbus上的?
2.storm的jar命令是由什么语言实现的?
3.参数jarfile表示什么?
4.topology的入口是什么?
5.main方法构建topology后,调用StormSubmitter类的哪个方法提交topology?
6.ComponentCommon定义了这个component的属性都包括什么?
7.submitTopology方法主要完成哪三件工作?



Storm官方文档翻译(1) ——从入门到精通
http://www.aboutyun.com/thread-12374-1-1.html
1.如何创建Storm拓扑(topologies)?
2.如何部署拓扑到Storm集群中?
3.Storm中的核心抽象概念就是流,流具体指什么?
4.流的源头是什么?

R语言学习路线图
http://www.aboutyun.com/thread-12375-1-1.html



资源:

漫画统计学入门
http://www.aboutyun.com/thread-12366-1-1.html

统计学的世界(第五版、六版)【663页|1443页】
http://www.aboutyun.com/thread-12367-1-1.html

统计学与R三小时入门
http://www.aboutyun.com/thread-12368-1-1.html

大科学 大数据理念的初步实践
http://www.aboutyun.com/thread-12373-1-1.html

问答:

php通过thrift操作hbase的问题
http://www.aboutyun.com/thread-12376-1-1.html












about云2015年04月04日每日一读

每天进步一点点


Spark初级入门详解2:入门介绍
http://www.aboutyun.com/thread-12350-1-1.html
1.Spark将中间结果保存在内存还是硬盘?
2.Spark什么情况下写入磁盘?
3.Spark包含哪些特性?
4.Spark支持哪些语言?
5.Spark生态系统都包含什么?
6.Spark体系架构包含哪些组件?
7.如何与Spark交互?


openstack搭建完毕,企业该如何做好容灾工作
http://www.aboutyun.com/thread-12348-1-1.html
1.openstack对容灾目前发展如何?
2.openstack在哪几方面做了相应的措施?
3.openstack swift如何实现复制虚机映像?


Azure云:大数据时代的机器学习平台
http://www.aboutyun.com/thread-12351-1-1.html
1.云计算有哪四层结构?
2.云计算的商业模式分为哪三类?
3.Azure云机器学习平台有什么特点?


IntelliJ IDEA 14.1支持Docker,用Docker搬运代码变得更加简单
http://www.aboutyun.com/thread-12352-1-1.html
1.IntelliJ IDEA 14.1支持Docker.能带来什么好处?
2.IntelliJ IDEA如何实现支持Docker?
3.Docker平台提供了哪些PaaS特性?



Spark SQL 1.3.0 DataFrame介绍、使用及提供了些完整的数据写入
http://www.aboutyun.com/thread-12358-1-1.html
1.DataFrame是什么?
2.如何创建DataFrame?
3.如何将普通RDD转变为DataFrame?
4.如何使用DataFrame?
5.在1.3.0中,提供了哪些完整的数据写入支持API?




Hadoop YARN 大数据解决方案进段应用
http://www.aboutyun.com/thread-12356-1-1.html
1、了解Hadoop版本衍化都有那些?
2、了解Hadoop版本号、以及Hadoop2.0版本产生的背景?
3、如何理解Hadoop2.X的基本构成?

基于Greenplum Hadoop 分布式平台的大数据解决方案
http://www.aboutyun.com/thread-12357-1-1.html
1、什么是Greenplum?
2、如何理解Greenplum的架构?
3、Greenplum架构中Master Host、Segment、Interconnect分别是什么?

IntelliJ IDEA导航特性Top20
http://www.aboutyun.com/thread-12359-1-1.html
1.Ctrl+F12快捷键完成IntelliJ IDEA什么功能?
2. Alt+Home完成IntelliJ IDEA什么功能?
3.IntelliJ IDEA跳转至指定类?



国外个人作品介绍:构建个人私有云案例,保护数据隐私的控制权(3)
http://www.aboutyun.com/thread-12354-1-1.html

国外个人作品介绍:构建个人私有云案例,保护数据隐私的控制权(4)
http://www.aboutyun.com/thread-12355-1-1.html

资源:
机器学习视频
http://www.aboutyun.com/thread-12360-1-1.html

问答:
hive有没有把日期转成long类型的函数
http://www.aboutyun.com/thread-12341-1-1.html


hadoop2.6部署警告: Unable to load native-hadoop library for your platform
http://www.aboutyun.com/thread-12343-1-1.html

如何做云备份
http://www.aboutyun.com/thread-12344-1-1.html

新手问个问题,请高手解答下,谢啦
http://www.aboutyun.com/thread-12349-1-1.html












about云2015年04月03日每日一读

每天进步一点点

Redis 3.0.0正式版发布,全新的分布式高可用数据库
http://www.aboutyun.com/thread-12331-1-1.html
1.Redis 3.0.0 最重要新特性是什么?
2.Redis 3.0.0做了哪些更新?
3.Redis为什么被称为数据结构服务器?


Hadoop生态圈介绍及入门
http://www.aboutyun.com/thread-12339-1-1.html
1.Hadoop生态圈介绍了哪些组件,分别都是什么?
2.大数据与Hadoop是什么关系?

Hive on Spark简介
http://www.aboutyun.com/thread-12334-1-1.html
1.在Hive on Spark设计原则是什么?
2.Hive on Spark,hive,Spark都做了哪些修改?
3.在Hive on Spark下,表格建立本质是什么?

关于Lucene 3.0升级到Lucene 4.x 记录
http://www.aboutyun.com/thread-12336-1-1.html
1.如何实现构建RAMDirectory,将索引放入内存中?
2.自定义分词:3.0 ,4.x有什么不同?
3. 4.x 如何实现构建多索引目录?


机器学习数据采集入门个人经验总结
http://www.aboutyun.com/thread-12337-1-1.html
1.数据采集保持属性一致性是指什么?
2.如何避免序列化和二进制?
3.为什么使用队列服务?




资源:

about云12-openstack glance基础知识及视频下载
http://www.aboutyun.com/thread-12326-1-1.html

大数据分析对于中国医疗保险管理的价值
http://www.aboutyun.com/thread-12333-1-1.html

搭建HBase+thrift+php环境
http://www.aboutyun.com/thread-12335-1-1.html

Software and Services Software and Services Tachyon介绍及应用总结
http://www.aboutyun.com/thread-12338-1-1.html

问答:

storm-hive丢失数据
http://www.aboutyun.com/thread-12328-1-1.html

虚拟机不能ping通主机了
http://www.aboutyun.com/thread-12329-1-1.html

Sqoop1.4.4实现关系型数据库多表同时导入HDFS或Hive中
http://www.aboutyun.com/thread-12330-1-1.html

hive表有一千万条数据,查询根本没反应
http://www.aboutyun.com/thread-12325-1-1.html

在Hadoop2.X中如果不做HA,NN挂机集群还可以正常运行
http://www.aboutyun.com/thread-12327-1-1.html

上传ISO
http://www.aboutyun.com/thread-12321-1-1.html










about云2015年04月02日每日一读

每天进步一点点


ZooKeeper 常用操作API详解及相关对象的解释说明
http://www.aboutyun.com/thread-12315-1-1.html
1.一个ACL对象哪两部分组成?
2.perm. ZooKeeper中有5种权限,分别是什么?
3.zkCli如何创建临时节点和永久节点?
4.setData & getData的功能是什么?
5.ZooKeeper有哪些API,都用来完成什么功能?



Spark 1.3.0版中 DataFrame 实践
http://www.aboutyun.com/thread-12312-1-1.html
1.如何把JSON文件转化为DataFrame?
2.如何将MySQL表转化为DataFrame对象?
3.spark如何是先查询hive表?

Apache Spark发布1.3版本,引入Data Frames、改进Spark SQL和MLlib
http://www.aboutyun.com/thread-12311-1-1.html
1.spark1.3增加了哪些功能?
2.DataFrames可以用来做什么?
3.机器学习库Spark MLlib本文讲的实现了哪些新的学习算法?
4.Spark增加了哪些更高级功能?


IBM是如何使用spark的
http://www.aboutyun.com/thread-12313-1-1.html
1.IBM如何使用Spark 技术的?带来了哪些好处?
2.本文spark有哪些应用场景?
3.IBM如何使用应用Spark 技术时遇到了哪些问题?是如何解决的?



算法起源及对算法的思考
http://www.aboutyun.com/thread-12310-1-1.html
1.中国算法起源于中国那本汉书?
2.什么是算法?
3.算法的核心是什么?

用大数据洞察用户
http://www.aboutyun.com/thread-12314-1-1.html
1.用户画像的技术架构图,本文分为了哪5层?
2.百分点的画像标签体系包括什么?
3.本文如何分析大数据用户画像的?





问答:
hbase导入数据到solr,或者elasticsearch
http://www.aboutyun.com/thread-12308-1-1.html

MR执行报错,就各位朋友给点意见
http://www.aboutyun.com/thread-12309-1-1.html


Ubuntu juno 在虚拟机上面按照网卡设置
http://www.aboutyun.com/thread-12316-1-1.html

在windows环境下用myeclipse构建了一个storm的demo,运行的时候报java.io.IOExcept
http://www.aboutyun.com/thread-12317-1-1.html

case _:Cat与 case _ =>区别
http://www.aboutyun.com/thread-12318-1-1.html

for表达式在转译时是怎么判断是转换为Map还是flatMap呢?
http://www.aboutyun.com/thread-12319-1-1.html








about云2015年04月01日每日一读

每天进步一点点

Spark初级入门详解
http://www.aboutyun.com/thread-12296-1-1.html
1.spark中什么是Application?
2.spark中什么是Driver Program?
3.Executor负责什么?
4.什么是Stage?
5.客户Spark程序(Driver Program)来操作Spark集群是通过哪个对象来进行的?
6.创建SparkContext一般要经过几个步骤?
7.Spark的运行模式取决于什么?
8. RDD的共享变量有几种?

豆瓣技术总监:Python Web开发领域经验总结
http://www.aboutyun.com/thread-12297-1-1.html
1.phython的优点有哪些?
2.豆瓣为什么一直使用phython?
3.通过本文你对phython又有哪些新的认识?


分布式云端机器学习
http://www.aboutyun.com/thread-12298-1-1.html
1、如何选择正确的机器学习平台?
2、机器学习的查询统计模型是什么?
3、机器学习的瓶颈是什么、以及如何突破瓶颈?


Spark on YARN两种运行模式介绍
http://www.aboutyun.com/thread-12294-1-1.html
1.Spark在YARN中有几种模式?
2.Yarn Cluster模式,Driver程序在YARN中运行,应用的运行结果在什么地方可以查看?
3.由client向ResourceManager提交请求,并上传jar到HDFS上包含哪些步骤?
4.传递给app的参数应该通过什么来指定?
5.什么模式下最后将结果输出到terminal中?


INTELLIJ IDEA环境配置开发Spark应用
http://www.aboutyun.com/thread-12295-1-1.html
1.如何加大IDEA的启动内存?
2.IDEA会生成大量的缓存文件,如何修改缓存文件路径?
3.使用IDEA开发Spark程序本文经过了几个步骤?








问答:

python Exception Type:TemplateDoesNotExit
http://www.aboutyun.com/thread-12289-1-1.html


spark-shell yarn-client模式启动异常问题
http://www.aboutyun.com/thread-12291-1-1.html

SparkStreaming运行提示错误,求救
http://www.aboutyun.com/thread-12292-1-1.html

spark开发环境搭建,如何找到spark-assembly-1.3.0-hadoop2.5.0-cdh5.3.0.jar
http://www.aboutyun.com/thread-12299-1-1.html

应用服务器 通过 jdbc 执行 spark sql ?
http://www.aboutyun.com/thread-12300-1-1.html

Hadoop-eclipse-plugin访问DFS
http://www.aboutyun.com/thread-12301-1-1.html

怎样在程序中得到HDFS的块大小
http://www.aboutyun.com/thread-12302-1-1.html

运行MR的时候 map运行到100%, reduce 67%卡主之后不再运行
http://www.aboutyun.com/thread-12303-1-1.html





没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条