分享

2016年about云10月第05周经典帖子总结

小桥流水 发表于 2016-10-29 16:23:42 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 4232
Spark实现LDA实例
http://www.aboutyun.com/thread-20130-1-1.html
1. LDA主题模型算法简介
2. Spark实现LDA的GraphX基础
3. PySparkml库中Clustering LDA简介
4. LDA求解的优化器模型
5. Spark实现LDA的步骤
6. 使用pySpark实现LDA
7. 使用scala的Spark实现LDA




乐视分享:为何将Storm数据存储到 HBase
http://www.aboutyun.com/thread-20122-1-1.html
1. HBase 实时指标存储与传统方案 (Redis/MySQL) 对比有什么优势?
2. HBase 在写入时需要注意哪些?
3. HBase 的 Client 的特点有哪些?
4. Redis/Mysql 存储方案存在哪些缺点?




Kafka源码分析--Kafka client是如何基于NIO构建自己的network层
http://www.aboutyun.com/thread-20109-1-1.html
1、如何理解Network层的分层架构?
2、Network层组件与NIO组件的映射关系是什么?
3、Kafka Selector、NetworkClient实现思路有哪些?
4、连接检测&自动重连机制有哪些?




基于spark用户协同过滤算法的实现
http://www.aboutyun.com/thread-20100-1-1.html
1、如何基于用户协同过滤的?
2、使用idea是如何打包的?
3、UserBase推荐算法主要做哪些工作?
4、如何运行jar?
5、运行jar时有哪些注意事项?



Kafka源码分析Producer的网络层——JAVA NIO封装
1.Java NIO有哪些组件?
2.Unix环境有哪几种网络IO模型?
3.Selector和epoll在事件的注册上面有哪些区别?



openstack基础之python的多线程并发库函数——eventlet
1.什么是协程?
2. eventlet是做什么用的?
3.怎样通过eventlet实现一个爬虫?



资源:

学习spark-快速大数据分析

Storm源码分析书籍【适合入门推荐】

Sqoop之Oracle导数入Hive

神经网络与机器学习(原书第3版)[推荐]

hadoop安装CDH5

Sqoop中文手册


问答:

oozie与kettle的比较,大家怎么看?

Spark Streaming中读取本地文件,无法获取数据

CM初始化报log4j:ERROR Could not find value for key log4j.appender.A


没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条