分享

about云每日一读汇总(第29篇2018.11.01)


about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)

about云每日一读汇总(第十三篇2016.04.01)

about云每日一读汇总(第十四篇2016.05.16)

about云每日一读汇总(第十五篇2016.07.18)

about云每日一读汇总(第十六篇2016.10.18)

about云每日一读汇总(第十七篇2016.12.05)

about云每日一读汇总(第十八篇2017.01.05)

about云每日一读汇总(第19篇2017.03.24)

about云每日一读汇总(第20篇2017.06.01)

about云每日一读汇总(第21篇2017.08.01)

about云每日一读汇总(第22篇2017.09.30)

about云每日一读汇总(第23篇2017.12.08)

about云每日一读汇总(第24篇2018.01.02)

about云每日一读汇总(第25篇2018.03.21)

about云每日一读汇总(第26篇2018.05.01)

about云每日一读汇总(第27篇2018.07.02)


about云每日一读汇总(第28篇2018.09.03)

关注最新经典文章,欢迎关注公众号

about云2018年12月29日每日一读


Spark 高级分析:第十章第3节 Parquet格式与列式存储
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26548
1.什么是Parquet
2.Parquet底层原理是什么

3.
如何定义使用谓词类



文档:
Hadoop性能调优与运维
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26551


HDP2.3安装文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26552




about云2018年12月28日每日一读


彻底明白Flink系统学习16:【Flink1.7】DataSet 编程之Data Sinks详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26546
1.DataSet 有哪些内置Sink?
2.Flink Sink的作用是什么?
3.DataSet 输出数据如何实现本地排序?
4.Sink是否支持全局排序?


文档:
大数据行业商业模式与建模2018-12-25
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26544


应用预测建模中文
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26545





about云2018年12月27日每日一读


彻底明白Flink系统学习15:【Flink1.7】DataSet 编程之Data Sources详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26540
1.Flink如何获取各种不同格式的文件,转换为dataset?
2.Flink sources有哪些类型?
3.Flink是否可以读取压缩文件?
4.Flink读取压缩文件有什么缺点?
5.Flink如何遍历读取目录中的文件?



文档:
ClickHouse多文档汇总:迁移到ClickHouse实用指南等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26541


书籍:
程序员的数学 2 概率统计 ,平冈和幸,(日)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26538




about云2018年12月26日每日一读


安装配置:
一步步实践在Redhat7.4系统安装CDH6.1 Hadoop集群
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26534
1、集群安全前置准备有哪些?
2、如何安装外部数据MySQL?
3、如何安装Cloudera Manager?
4、如何安装CDH集群?


书籍:
Kubernetes实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26536

大数据算法.王宏志(详细书签)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26535




about云2018年12月25日每日一读


彻底明白Flink系统学习14:【Flink1.7】DataSet 编程之Transformations详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26531
1.DataSet与 Datastream Transformations 都有哪些API?
2.DataSet MapPartition的作用是什么?
3.ReduceGroup与Reduce有什么区别?
4.Join Hints是什么?
5.Flink是否所有外部联接类型都支持所有执行策略?
6.CoGroup与join的区别是什么?
7.Cross使用需要注意什么?
8.Range-Partition可以解决什么问题?


Flink中cogroup, join和coflatmap比较
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26532
1.Flink 双数据流转换为单数据流操作有哪些?
2.cogroup, join和coflatmap各自完成什么事情?
3.cogroup, join和coflatmap区别是什么?



文档:
区块链的应用【2018年11月】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26530


书籍:
机器视觉【王亮、蒋欣蓝】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26529


疑问解答:
hive decode函数使用例子给一个?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26528





about云2018年12月24日每日一读


Spark 高级分析:第十章第2节用ADAM CLI摄取基因组学数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26522
1.什么是ADAM
2.如何使用ADAM

3.
如何分析结果



CDH6.1 版本发布:新功能详细介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26524
1.CDH6.1有哪些新功能?
2.CDH免费版限制多少个节点?
3.CDH6.1有哪些细粒度权限?



书籍:
动手学深度学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26525


spark优化详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26526




about云2018年12月21日每日一读


彻底明白Hadoop map和reduce的个数决定因素【白话】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26518
1.Hadoop 设置map的个数后为什么不生效?
2.map的个数有什么来决定?
3.如何确定分片的大小?
4.reduce个数该如何设置?
5.reduce个数由什么来决定?



文档:
Hive优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26516


书籍:
Hadoop大数据处理 (刘军著)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26517





about云2018年12月20日每日一读


彻底明白Flink系统学习13:【Flink1.7】流连接器介绍及如何添加连接器
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26512
1.Flink有哪些内置连接器?
2.Flink二进制发布包中是否直接可以使用连接器?
3.如何才能添加连接器?
4.连接器使用有那两种方式添加?
5.连接器添加jar包的方式,如何才能生效?


文档:
共享单车服务系统研究与大数据处理【吕丹】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26514


hive微博项目及解析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26513




about云2018年12月19日每日一读


阿里AnalyticDB数据仓库实现海量数据实时分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26503
1、AnalyticDB整体架构有哪些组件?
2、AnalyticDB有哪些核心技术?
3、玄武存储引擎有哪些优点?
4、羲和计算引擎是什么?



文档:
阿里巴巴大牛讲解技术汇总【七文档】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26508


机器学习基础教程【价值50块钱】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26507


问答:
flume1.8是否可以监听的同时打印此时监听的精准时间
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26505


方案探讨:
Yarn配置:如何指定物理CPU核心数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26504





about云2018年12月18日每日一读


彻底明白Flink系统学习12:【Flink1.7】如何控制流物理分区
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26497
1.如何实现Flink流分区?
2.对于数据倾斜,该使用什么函数实现数据均衡?
3.Rescaling与rebalance有什么区别?



如何利用业余时间,掌握数据分析硬技能【课程】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26498


文档:
HBase性能优化方法总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26500

某集团大数据平台整体方案建议书
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26499




about云2018年12月17日每日一读


连载:
Spark 高级分析:第十章第1节 解耦存储与建模
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26490
1.本章主要目的有哪些
2.
什么是Avro
3.
现有的RPC框架有哪些?有何异同?



职业指导:
三大思维成就优秀工程师,你具备哪些?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26493


书籍:
Python数据科学导论  概念、技术与应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26494


文档:
大数据平台运维架构实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26495





about云2018年12月14日每日一读

连载型:
彻底明白Flink系统学习11:【Flink1.7】事件时间、处理时间、提取时间有什么区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26488
1.事件时间、处理时间、提取时间的顺序是什么?
2.事件时间为何需要水印?
3.处理时间是否提取的当前系统的时间?
4.数据到达Flink的时间是什么时间?


书籍:
大数据架构详解:从数据获取到深度学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26486


深入理解Java虚拟机_JVM高级特性与最佳实践 第2版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26485




about云2018年12月13日每日一读


连载:
彻底明白Flink系统学习10:窗口生命周期、Keyed和非Keyed及分配器诠释
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26483
1.窗口是什么时候开始创建的?
2.窗口删除是什么时候?
3.如何延迟窗口删除?
4.Keyed和Non-Keyed Windows有什么不同?
5.在所有的窗口中,哪一个窗口是不基于时间的?


领取100本书+1T资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26480


文档:
亿级大数据实时分析之旅
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26481


书籍:
深入理解OpenStack Neutron
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26482






about云2018年12月12日每日一读


连载型:
TensorFlow ML cookbook 第六章2、3节 运行门和激活功能、实现单层神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26476
1、如何创建两个具有相同结构的单层神经网络?
2、如何声明两个模型参数?
3、如何设置迭代次数和激活函数?
4、如何理解完全连接的神经网络?




文档:
HBaseRowKey与索引设计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26473


Hive数据仓库全流程开发
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26474


组件下载:
springboot mybatis phoenix链接测试
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26477


疑问解答:
flume1.8是否可以解决多级目录检索
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26472






about云2018年12月11日每日一读


彻底明白Flink系统学习9:【Flink1.7编程】数据流Transformations介绍2窗口及相关操作
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26469
1.为何产生window窗口计算?
2.你认为什么情况下使用Window Apply?
3.Window Fold可以用来做什么?
4.window 流是否可以union和join?
5.DataStream是否可以split?



书籍:
拥抱大数据新常态下的数据分析典型案例 [李倩青,王震 著] 2015年版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26467


Elasticsearch技术解析与实战-高清版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26466




about云2018年12月10日每日一读


连载型:
Spark 高级分析:第九章第10,11节 返回值分布可视化和结果评估
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26457
1.如何将返回结果可视化
2.
如何对结果进行评估
3.
蒙特卡洛风险模拟可以用来做什么




使用SQL Developer客户端访问Kerberos环境下的Hive
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26459
1.怎样安装Kerberos客户端?
2.怎样用LDAP方式访问Hive?
3.怎样用Kerberos方式访问Hive?
文档:
Hive权限设置说明文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26462
神经网络与深度学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26463






about云2018年12月07日每日一读


机器学习逻辑回归详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26452
1.什么是逻辑回归?
2.如何处理因变量取值离散的情况?
3.如何求解w、b?
4.逻辑回归有哪些用途?


实践型:
计算订单明细中那些组合商品更受欢迎
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26451


小知识点:
什么是DAPP
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26453



文档:
阿里巴巴java开发手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26455


书籍:
Hadoop数据仓库实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26454







about云2018年12月06日每日一读


连载:
彻底明白Flink系统学习8:【Flink1.7编程基础】DataStream Transformations介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26445
1.Flink中Map函数和FlatMap函数有什么区别?
2.如何生成KeyedStream?
3.KeyedStream如何转换为DataStream ?
4.min和minBy之间的差异是什么?


疑问解答:
Spark2.3/2.4可以直接使用hive2/3的元数据吗,是否需要重新编译
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26442


impala不用rpm如何安装
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26449



文档:
Windows-10-编译-hadoop详细步骤
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26446


Flink实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26447


区块链3.0共识蓝皮书
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26448





about云2018年12月05日每日一读


论实时推荐算法在阿里百亿特征上的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26439
1、弹性改造及优势有哪些?
2、如何进行离线训练优化?
3、如何理解特征动态增删技术?
4、如何理解模型压缩和稳定性?




名企资源:
华为大数据介绍-江苏
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26438


文档:
CDH开启Kerberos+Sentry权限控制-实施配置指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26437




about云2018年12月04日每日一读


彻底明白Flink系统学习7:【最新基于Flink1.7】使用DataStream API进行数据处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26434
1.流处理和批处理分别入口是什么?
2.对于本地和远程运行程序,都可以使用哪个函数?
3.Flink数据源分为哪两类?
4.Flink DataStream和DataSet source都是基于什么格式?
5.Flink中kafka source是否为自定义?

书籍:
spark权威指南(基于spark 2)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26432

文档:
区块链知识 - 智能合约(普及篇)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26431

疑问解答:
cdh hbase经常报告slow read
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26430

异常错误:
dashboard无法删除云主机,指令也删不掉
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26429




about云2018年12月03日每日一读


版本说明:
Flink1.7稳定版本发布:新增功能介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26424
1.Flink1.7开始支持Scala哪个版本?
2.Flink1.7状态演变在实际生产中有什么好处?
3.Streaming SQL支持MATCH_RECOGNIZE有什么好处?
4.支持Flink SQL / Table API中的富集连接可以做那些事情?
5.Flink1.7新增了哪些连接器?


实操演练:
DBeaver实战之访问Kerberos环境下的Hive
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26425
1.如何使用DBeaver访问Kerberos环境下的Hive?
2.怎样配置Kerberos环境变量?
3.怎样配置DBeaver?



连载:
Spark 高级分析:第九章第8,9节 多元正态分布和试验
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26422
1.什么是多元正态分布
2.
将多元正态分布拟合到我们的数据中需要做什么
3.如何进行数据试验



文档:
阿里双十一技术
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26427


书籍:
大数据Spark企业级实战版【813页】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26426




about云2018年11月30日每日一读


总结型:
HIVE生产环境优化措施总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26420
1.如何开启Fetch?
2.哪些情况下,hive执行不使用MapReduce?
3.本地模式适用于什么情况?
4.小表与大表新版本是否需要优化?
5.大表与大表空值比较多该如何优化?
6.如何在Map端join?
7.动态分区的作用是什么?
8.数据倾斜有哪些措施?
9.严格模式你认为什么情况下会用到?

实践型:
RPM命令失效该如何解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26419

名企资源:
华为金融大数据解决方案汇报V2.0
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26418

文档:
ClickHouse中文文档【334页】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26417

异常错误:
mapreduce执行自带的wordcount例子报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26415






about云2018年11月29日每日一读

彻底明白Flink系统学习6:Flink最全最详细集群安装【带有各种说明】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26396
1.ssh安装需要注意什么问题?
2.Flink集群配置文件是哪个?
3.Flink常用配置参数的含义是什么?
4.如何具体配置某个taskmanager的内存?
5.如何指定taskmanager?
6.如何指定nodemanager?
7.如何启动集群?


实操演练:
应用shell脚本处理hadoop中FsImage小文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26405
1、Hadoop集群大量小文件对集群造成什么影响?
2、如何使用hdfs oiv命令解析FsImage文件?
3、如何使用FsImage分析脚本处理小文件?
4、如何使用Sqoop抽取MySQL中Hive元数据表数据到Hive?


实践型:
虚拟机VMware12中Linux(centos7)网卡地址相同遇到问题总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26409



书籍资源:
Java 核心技术 第10版(卷一中文版+英文版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26406


Java 核心技术 第10版高级特性(卷II中文版+英文版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26407


疑问解答:
求助,zeppelin 数据查询异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26410


异常错误:
sqoop导入数据问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26411




about云2018年11月27日每日一读


彻底明白Flink系统学习5:window、Linux本地安装Flink
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26393
1.如何在window下安装Flink?
2.Flink本地安装启动命令与原先版本有什么区别?
3.window和Linux本地启动命令有什么区别?

4.如何查看Flink web ui?


集群安装准备工作:Hadoop、Spark、Flink等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26395
1.网络配置你认为集群是否都需要?
2.为何集群安装都需要配置ssh?
3.java为何 要安装?


书籍:
趣学算法【孙小玉】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26397




about云2018年11月26日每日一读

实操演练:
通过实践验证HDFS纠删码的机架感知策略
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26389
1.什么情况下不建议对小文件使用纠删码策略?
2.怎样进行机架容错?
3.如何根据文件大小以及纠删码策略计算block group数量以及每个block的大小?

连载:
Spark 高级分析:第九章第6,7节 权重因子的确定和数据抽样
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26386
1.如何确定权重因子
2.如何拟合线性模型?

3.如何进行数据抽样



书籍:
程序员健康指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26391


Bloom Filter文档汇总【算法】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26390




about云2018年11月23日每日一读


彻底明白Flink系统学习4:功能点介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26377
1.为什么说Flink是高性能?
2.什么是Flink状态计算?
3.Flink如何实现容错的?
4.Flink为何要内存管理?
5.Flink中流处理和批处理的关系是什么?

OpenCV 4.0正式发布!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26373
1.学习OpenCV是从新版本学习,还是从旧版本学习?
2.OpenCV优化了持久层,可以做哪些事情?
3.OpenCV介绍了哪些新特性?
4.OpenCV有哪些新模块?

外站经典:
Flink实战教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26378


文档:
CDH集群安装部署运维手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26380


Flink文档【sql、IO、事件时间处理和Watermarks】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26379



异常错误:
已经一周勒,网上看帖子都没能解决,求大神指点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26382


疑问解答:
hive查询结果完成后,am一直running
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26381

hive on spark 的资源调度问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26375

方案探讨
MapReduce里面自定义的InputFormat重写isSplitable()
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26376




about云2018年11月22日每日一读


彻底明白Flink系统学习3:编程知识之Flink程序结构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26371
1.Flink程序结是什么结构?
2.Flink中source,sink分别是什么意思?
2.Flink数据源有哪些?
3.如何自定义Flink数据源?
4.Flink如何定义Sink?


书籍:
Hadoop应用架构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26368


面试题汇总:
大数据面试题汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26367




about云2018年11月21日每日一读


连载:
TensorFlow ML cookbook 第六章1节 神经网络-实施操作入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26359
1、什么是神经网络?
2、什么是神经网络重要的特性?
3、如何实现简单的神经网络?
4、优化算法如何声明为标准梯度下降?



书籍:
Redis开发与运维(完整版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26363


组件下载:
win10系统编译好的hadoop源码【Hadoop2.7.1】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26364


异常错误:
secure DataNode无法启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26361




about云2018年11月20日每日一读


彻底明白Flink系统学习2:Flink分布式执行包括调度、通信机制、检查点等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26357
1.Flink提交到运行程序涉及哪些进程?
2.Flink slot是什么?
3.Job客户端是不是Flink内部部分,它的作用是什么?
4.Flink通信机制是什么?
5.Actor系统包含哪些内容?


书籍:
Spark内核设计的艺术:架构设计与实现【完整版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26358


其它:
【连载】深度学习笔记14:CNN经典论文研读之Le-Net5及其Tensorflow实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26354




about云2018年11月19日每日一读


Scala实战之访问Kerberos环境的HDFS
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26348
1.如何使用Scala代码访问Kerberos环境的HDFS?
2.怎样导出Kerberos集群中访问HDFS的keytab文件?
3.怎样实现客户端访问HDFS工具类?

企业为什么选择使用Cloudera Manager
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26350

Cloudera实战课程介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26351

文档:
提高Flink易用性【 阿里 砚田2018.11最新2文档】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26352




about云2018年11月16日每日一读


彻底明白Flink系统学习1:Flink介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26343
1.Flink有哪三种运行模式?
2.Flink架构有几层?
3.Flink每层的作用是什么?
4.JobGraph是什么?
5.executiongraph是什么?


书籍:
相关性搜索:利用Solr与Elasticsearch创建智能应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26345


文档:
【 汇智 谭杰河】汇智在Flink上的实践【2018.11最新文档】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26344





about云2018年11月15日每日一读


Hbase 通过行键rowkey实现多区间查询
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26336
1.hbase的rowkey本文是如何设计的?
2.字符串是采用什么方式存储到rowkey中的?
3.模板数字的作用是什么?
4.什么是与运算?


文档:
Flink在袋鼠云一站式大数据平台中的使用【 2018.11最新文档】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26338


学习pyspark【书籍】:版本spark2.0
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26337


方案探讨:
电商中最佳商品组合计算
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26340




about云2018年11月14日每日一读

Kerberos CDH集群不同OS版本配置HDFS的Gateway节点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26334
1、如何进行时钟同步?
2、如何安装Kerberos客户端?
3、Kerberos如何进行客户端功能验证?
4、如何处理RedHat6.6 客户端异常问题?


英文资料:
使用Python应用深度学习【书籍】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26332


资源下载:
Hadoop面试题系列4:Java面试
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26331




about云2018年11月12日每日一读

Spark2.4.0发布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26319

Spark 高级分析:第九章第5节 数据预处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26315
1.预处理的数据数据格式是怎样的
2.哪些数据需要预处理?做怎样的处理?

3.预处理代码如何编写的


CDH集群高可用之在Kerberos环境下修改HOSTNAME
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26320
1.怎样配置环境及停止集群服务?
2.怎样修改集群HOSTNAME及集群服务配置?
3.怎样做功能验证?

视频:
Go语言三大套视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26317

Elasticsearch.权威指南(中文版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26323


Hadoop面试题系列3:大数据面试题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26322

问答:
求一个大数据相关项目idea 作为毕业设计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26318





about云2018年11月09日每日一读

Flink SQL详解及小案例应用:如何定义、使用及实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26308
1.为何会有Flink SQL?
2.本文哪些地方涉及Flink 1.7?
4.如何定义源(sources )和接收器(sinks)?
5.Flink SQL本文介绍了哪些sql?
6.将数据格式化为正确的格式以便进一步处理?
7.如何监控Flink sql查询
8.使用Flink SQL中的视图的作用是什么?
9.本文使用Flink sql实现了什么案例?


如何应对“智力型”的算法面试题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26313


英文资料:
Flink sql入门三大新文档【2018】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26311


资料下载:
Hadoop面试题系列2:Hadoop就业面试宝典
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26310


39天大数据学习汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26309


异常错误:
SparkStreaming 消费kafka数据异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26312


Hue测试连接出现找不到altscript.sh
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26307








about云2018年11月08日每日一读

解说解说:
Apache Flink中Savepoints和Checkpoints之间的3个区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26299
1.Savepoints和Checkpoints是什么?
2.Savepoints和Checkpoints有哪三点区别?
3.何时在流应用程序中使用Savepoints?



文档:
39天大数据学习第39天:资料补充
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26301


下载:
Hadoop面试题系列1:各个公司就业面试宝典
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26304


面试题:
大数据面试题【无答案】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26302


大数据面试题【有答案】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26303


疑问解答:
MapReduce 从本地提交到集群 ,代码中不设置jar包位置,跑的时候就提示找不到Mapp'...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26297


关于mr的高效求topn的方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26298





about云2018年11月07日每日一读


技术 应用:
入门理解NLP中多通道卷积神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26294
1、如何理解多通道卷积神经网络?
2、如何随机初始化的embedding?
3、如何实现Multi_Channel_CNN?
4、如何应用stack函数?




名企资料:
孙金城丨阿里巴巴-Blink SQL关键技术及实现原理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26293



视频:
39天大数据学习第39天:Spark netty及通信
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26292





about云2018年11月06日每日一读


介绍解说:
什么是Hive 钩子,如何实现钩子?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26286
1.什么是Hive hooks?
2.什么是数据湖?
3.Hive钩子有哪些种类?
4.如何实现Hive钩子?



名企资源:
大数据之路:阿里巴巴大数据实践【书籍】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26288


视频:
39天大数据学习第38天:Spark mllib机器学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26287


异常错误:
读取hbase数据到hdfs api 报错 网上搜不到 求解  错误java.lang.NoSuchFieldError...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26285





about云2018年11月03日每日一读


autoencoder实现无监督学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26278
1.什么是autoencoder?
2.怎样做作无监督的Pretraining训练?
3.怎样实现无监督学习?



Spark 高级分析:第九章第3,4节 模型介绍和获取数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26271
1.什么是蒙特卡洛风险模型
2.模型公式是什么?

3.文中从哪里获取股票数据



名企资源:
新浪-高鹏_ClickHouse最佳实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26283


视频:
39天大数据学习第37天:广告平台精准推送系统解决方案(插播)等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26282






about云2018年11月02日每日一读

比Hive快279倍的数据库-ClickHouse到底是怎样的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26264
1.什么是ClickHouse?
2.ClickHouse适合哪些场景?
3.为什么面向列的数据库查询如此快?



文档:
Cloudera大数据解决方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26268


视频:
39天大数据学习第36天:Spark任务提交流程分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26267



疑问解答:
Rocky版上传镜像错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26266


方案探讨:
HDFS数据导入HIVE方案探讨
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26265




about云2018年11月01日每日一读


介绍解说:
为什么要在Kubernetes上运行Kafka,有哪些问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26252
1.为什么要在Kubernetes上运行Kafka?
2.Kafka在Kubernetes需要注意哪些问题?
3.在Kubernetes上的部署Kafka时,需要什么团队方面的合作?



小知识点:
Cloudera Enterprise 6提高Hive执行效率2.2倍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26251


视频:
39天大数据学习第35天:Spark源码阅读
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26255


书籍:
亿级流量网站架构核心技术
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26254





已有(2)人评论

跳转到指定楼层
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条