分享

about云每日一读汇总(第26篇2018.05.01)





about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)

about云每日一读汇总(第十三篇2016.04.01)

about云每日一读汇总(第十四篇2016.05.16)

about云每日一读汇总(第十五篇2016.07.18)

about云每日一读汇总(第十六篇2016.10.18)

about云每日一读汇总(第十七篇2016.12.05)

about云每日一读汇总(第十八篇2017.01.05)

about云每日一读汇总(第19篇2017.03.24)

about云每日一读汇总(第20篇2017.06.01)

about云每日一读汇总(第21篇2017.08.01)

about云每日一读汇总(第22篇2017.09.30)

about云每日一读汇总(第23篇2017.12.08)

about云每日一读汇总(第24篇2018.01.02)


about云每日一读汇总(第25篇2018.03.21)

about云2018年06月29日每日一读

吴恩达《Machine_Learning_Yearning》中文版:第36-43章 训练数据
http://www.aboutyun.com/thread-24730-1-1.html
1.开发/测试集打乱会有什么结果?
2.开发/测试集选择遵循什么原则?
3.预测房价,不同城市的数据该如何处理?
4.什么情况下给数据加权重?
5.什么是“训练开发”集?


吴恩达《Machine_Learning_Yearning》中文版:第44-46章优化验证
http://www.aboutyun.com/thread-24731-1-1.html
1.什么情况下执行优化验证测试?
2.优化验证测试的一般形式是什么?
3.教直升机复杂的飞行动作如何进行优化验证的?



文档:
spark structured streaming结构化流
http://www.aboutyun.com/thread-24735-1-1.html


插件:
hadoop-eclipse-plugin-2.7.3.jar插件下载
http://www.aboutyun.com/thread-24736-1-1.html



疑问解答:
sparkstreaming多consumer消费kafka报错问题
http://www.aboutyun.com/thread-24729-1-1.html


两个agent消费同一个kafka的topic,输出到各自的文件夹中如何实现?
http://www.aboutyun.com/thread-24733-1-1.html


Structured Streaming Kafka Offset
http://www.aboutyun.com/thread-24734-1-1.html


sparkstreaming多consumer消费kafka报错问题
http://www.aboutyun.com/thread-24729-1-1.html




about云2018年06月28日每日一读

你会让人工智能为你做决定吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24725
1.你认为我们已经将那些事情委托给人工智能?
2.你认为人工智能是否可以做更多的事情?
3.你认为人工智能未来可以做那些事情?



书籍:
精通Scrapy网络爬虫
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24727





about云2018年06月27日每日一读

区块链将如何重新定义世界
http://www.aboutyun.com/thread-24719-1-1.html
1、区块链的本质到底是什么?
2、区块链面临的两大技术挑战是什么?
3、区块链技术未来的发展脉络是什么?




书籍:
区块链+将如何重新定义世界
http://www.aboutyun.com/thread-24721-1-1.html


疑问解答:
oozie  ssh port非22怎么设置
http://www.aboutyun.com/thread-24720-1-1.html


目录权限问题
http://www.aboutyun.com/thread-24722-1-1.html




about云2018年06月26日每日一读

技术应用:
贝叶斯统计如何说服我去健身房【附源码】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24715
1.越南男性的身高与体重呈正线性关系,做着是如何找出关系根源的?
2.本文利用线性回归理论挖掘什么问题?
3.本文如何利用贝叶斯方法进行线性回归?


实操演练:
yarn配置cgroup隔离cpu资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24717
1.如何使用cgroup来隔离cpu资源?
2.如何安装cgroup?
3.本文遇到了哪些问题,如何解决的?


书籍:
Kafka源码解析与实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24716



疑问解答:
yarn怎么限制cpu资源使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24712


请问怎么测出namenode元数据占用的内存
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24714


异常错误:
【求助】hive启动失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24713






about云2018年06月25日每日一读

安装配置:
window从零开始AI开发实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24709
1.怎样安装Visual Studio?
2.怎样安装python?
3.怎样安装VS Tools For AI插件?

连载型:
Spark 高级分析:第六章第8,9节  低维度查询和评分以及词相关性
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24699
1.什么是余弦相似度,如何计算?
2.LSA有哪些降维的方式?
3
.LSA如何降维?

4.如何计算词之间的相似性?


总结型:
大数据场景下数据异构之 Mysql实时写入HBase(借助canal kafka SparkStreaming)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24702


书籍:
深入理解计算机系统(原书第三版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24701


SPARK MLLIB机器学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24700


小知识点:
为什么cdh安装需要配置禁用ipv6?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24706

问题解答:
启动hive报错----缺少spark-assembly-*.jar
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24707

问答:
centos7 Installation configuration zabbix3.X
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24708


疑问解答
各位老师,请问如何使用Scala计算微积分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24704




about云2018年06月22日每日一读

入门帮助:
如何上手深度学习中的图像处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24695
1.图像处理有哪些应用?
2.图像处理可以使用哪些工具?
3.图像处理该如何学习?
4.本文提供了哪些图像处理项目?



外站经典:
自然语言处理从上手到进阶【项目资源库汇总】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24696


文档:
深度学习图像处理文档汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24697





about云2018年06月21日每日一读

推荐:
通俗易懂:彻底明白什么是神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24691
1.你认为神经网络最重要的用途是什么?
2.什么是神经元?
3.什么是反向传播算法?


连载:
吴恩达《Machine_Learning_Yearning》中文版第28-32章 学习曲线
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24688
1.学习曲线的作用是什么?
2.当数据量变得越来越多时,学习曲线遇到什么问题?
3.存在训练集噪声致使难以正确理解曲线的变化时,该如何解决?


吴恩达《Machine_Learning_Yearning》中文版第33-35章 人类表现水平
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24689
1.为何与人类表现水平进行对比?
2.如何定义人类表现水平?
3.在哪些机器学习应用程序中,机器已经超越了人类的水平?


英文资料:
HBase3.0参考指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24690



疑问解答:

一个求最低折扣的题目
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24686


异常错误:
hive查表异常错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24687


求助:flume一直连接失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24692




about云2018年06月20日每日一读

Spark Summits大会介绍及如何下载相关视频资料【附2018年6月AI ppt下载】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24684
1.Spark Summit更名为什么名字?
2.Spark集群在哪些名企应用?
3.Spark Summit的相关视频和ppt在哪可以下载?


TensorFlow ML cookbook 第三章6-8节 套索和岭回归、弹性网络回归and Logistic回归
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24683
1、如何实现套索和岭回归?
2、如何实现弹性网络回归?
3、如何实施Logistic回归?
4、如何理解将线性回归转化为二元分类?





about云2018年06月19日每日一读

Spark 高级分析:第六章第7节 找到重要的概念
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24672
1.如何校验SVD的输出?
2.SVD中V代表什么?
3
.如何得到文档集?



TensorFlow 实战之利用5-4-9模型实现Keras
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24677
1.5-4-9模型是什么?
2.什么是五步法?
3.为什么要用函数式编程?



书籍:
Python极客项目编程附源码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24681



疑问解答:
在kylin web上执行测试用例  一直报这个错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24675




about云2018年06月15日每日一读

GPU介绍及TensorFlow如何使用GPU跑程序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24670
1.什么是GPU?
2.GPU的工作原理是什么?
3.什么类型的程序适合在GPU上运行?
4.TensorFlow如何使用GPU跑程序?





文档:
深入了解spark sql的高级性能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24669


外站经典:
国外大数据、数据挖掘、人工智能网站集合
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24667


疑问解答:
kylin 这个报错问题怎么解决啊 求教
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24664




about云2018年06月14日每日一读

连载:
TensorflowOnSpark系列1:为什么产生TensorFlowOnSpark
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24658
1.为什么产生TensorFlowOnSpark?
2.TensorFlowOnSpark解决了什么问题?
3.TensorFlowOnSpark是否支持TensorFlow进程通信?

TensorflowOnSpark系列2:TensorFlowOnSpark架构设计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24659
1.TensorFlowOnSpark的架构与设计包括哪两个基本内容?
2.将TensorFlow集群部署在Spark主要解决什么问题?
3.TensorFlowOnSpark的架构如何设计的?


TensorflowOnSpark系列3:安装部署
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24657
1.TensorflowOnSpark安装有哪些前提?
2.本文安装遇到了哪些坑?
3.后期遇到了哪些问题,又是如何解决的?


项目源码:
TensorFlow on Spark 源码分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24660


名企资源:
从TDW-Hive到TDW-Spark-SQL--腾讯TDW数据引擎演进之路-讲话
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24661



疑问解答:
spring和sparksql
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24656

异常错误:
hadoop-2.6.0-cdh5.9.3编译后启动报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24662





about云2018年06月13日每日一读

快速理解机器学习和人工智能的区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24653
1、什么是图灵测试?
2、人工智能五个重要学科有哪些?
3、什么是机器学习?
4、什么是神经网络?



文档:
Storm—基于拓扑的流数据实时计算系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24650


openstack--L版本安装文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24651


书籍:
从Lucene到Elasticsearch全文检索实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24652




about云2018年06月12日每日一读

区块链3.0EOS入门4:Hello World合约
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24645
1.如何上传合约?
2.合约如何运行?
3.什么是李嘉图(Ricardian)合约?


书籍:
Hadoop权威指南.大数据的存储与分析.第4版.修订版.升级版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24647


组件下载:
ext-2.2.zip
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24646



疑问解答:
急急急!openstack L版云硬盘挂载到云主机失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24642





about云2018年06月11日每日一读

连载:
Spark 高级分析:第六章第6节 第6节奇异值分解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24634
1.什么是奇异值分解?
2.SVD是什么?
3
.如何利用MLib得到奇异分解值?



面试题:
机器学习面试之GBDT详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24637
1.机器学习的流程是什么?
2.什么是前向分步算法?
3.什么是梯度提升思想?





文档:
2018版人工智能标准化白皮书
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24638


视频:
spark大型项目实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24639



疑问解答:
spark运行rdd过程中,调用方法的过程中卡死
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24633





about云2018年06月08日每日一读

Yarn调度之CapacityScheduler源码分析资源抢占
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24628
1.当抢占资源服务启动时,会启动一个线程每隔多长时间调用一次?
2.抢占资源的策略是什么?
3.什么情况下,强制回收资源?


区块链3.0EOS入门3:智能合约入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24631
1.如何创建钱包?
2.如何创建钱包?
3.私有链如何启动?


文档:
ApacheCN - Kibana 5.2 中文文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24629


书籍:
Python高级编程(清华)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24630



问题解答:
CDH5 在添加hdfs服务的时候namenode启动不了。。。帮帮我
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24627







about云2018年06月07日每日一读

连载:
区块链3.0EOS入门2:EOS常用概念术语汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24622
1.组件 Program包含哪些组件?
2.nodeos是什么组件?
3.cleos是什么?



外站经典推荐:
区块链介绍、教程、资料、项目
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24623



疑问解答:
关于YARN capacity调度器模式下队列超额资源的释放的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24621






about云2018年06月06日每日一读

自学构建深度学习项目:需要思考的问题及如何实现1
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24611
1.如何选择一个深度学习项目?
2.深度学习需要什么硬件准备?
3.高质量数据集应该包括哪些特征?



自学构建深度学习项目:需要思考的问题及如何实现2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24615
1.如何可视化深度学习模型和性能指标?
2.深度学习的问题解决包含哪些步骤?
3.如何分析误差?
4.如何提升深度学习模型性能及网络调参?



文档:
Apache Kafka的过去,现在,和未来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24616


小知识分享:
spark RDD分区是否可以指定分区
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24617




疑问解答:
请教,基于用户浏览情况如何计算用户相似度
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24613





about云2018年06月05日每日一读

区块链3.0EOS入门1:EOS介绍及安装编译EOS
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24607
1.什么是EOS?
2.为什么说EOS交易时间接近支付宝?
3.如何编译安装EOS?



文档:
EOS技术白皮书【中文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24605


异常错误
HDFS文件数据丢失重写,校验失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24603




about云2018年06月04日每日一读

连载型:
Spark 高级分析:第六章第4,5节 词形还原并计算TF-IDF
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24594
1.什么是词干?如何进行词形还原?如何用代码实现?
2.如何利用Spark MLib计算TF-IDF?
3
.计算TF-IDF有哪些步骤和注意点?


概念性:
基于卷积神经网络的物体检测之边框回归
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24599
1.什么是边框回归?
2.边框回归怎么做的?
3.为什么边框回归只能微调,在离Ground Truth近的时候才能生效?




功能源码:
Spark-LOF项目源码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24600


文档:
kafka-高性能揭秘及优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24601



疑问解答:
求助:hadoop安全审计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24596


大数据mapreduce疑惑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24597


关于LOF(局部异常因子)的问题,请教各位大神,感激不尽!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24598



about云2018年06月01日每日一读

入门帮助:
零基础入门SVM支持向量机
http://www.aboutyun.com/thread-24591-1-1.html
1.本文基础的线性SVM问题分为哪四个步骤?
2.支持向量机主要用于解决模式识别领域中什么问题?
3.SVM属于是否属于有监督学习算法?
4.什么是支持向量?
5.如何把SVM变成用数学语言描述的最优化问题模型?
6.一个最优化问题通常有两个最基本的因素?


文档:
kafka在人脸识别PAAS中的应用
http://www.aboutyun.com/thread-24592-1-1.html





about云2018年05月31日每日一读

连载型:
吴恩达《Machine_Learning_Yearning》中文版 第20-27章偏差和方差
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24584
1.误差有哪两大来源?
2.偏差和方差有什么区别?
3.处理偏差和方差问题最简单的形式有哪些?
4.偏差和方差间如何权衡?
5.如何减少方差?



区块链3.0详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24582
1.你是否认为区块链3.0超越货币、经济的公正作用?
2.什么是区块链政府?
3.什么是去中心化的的公共服务?
4.区块链公证和知识产权(IP)保护应用场景有哪些?



名企资源:
知乎基于Kubernetes的Kafka平台的设计和实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24585


疑问解答:
spark-streaming 的 transform 方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24586


关于gzip压缩的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24587


求助: 搭建hadoop集群后,可以访问到HDFS管理界面,但MR管理界面访问不...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24588


异常错误:
neutron port-update某个多值的选项时报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24583





about云2018年05月30日每日一读

一文理解深度学习概念及其应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24576
1、如何理解深度学习?
2、深度学习的模型结构有哪些?
3、深度学习训练算法有哪些?
4、深度学习优点有哪些?



吴恩达《Machine_Learning_Yearning》中文版 第17-19章误差分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24575
1.将大型开发集拆分为哪两个子集?
2.Eyeball 和 Blackbox 开发集该设置多大?
3.Eyeball 开发集的作用是什么?



名企资源:
腾讯云Kafka自动化运营实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24577



疑问解答:

泛型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24579


flume hdfssink gzip压缩造成部分文件损坏
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24580





about云2018年05月29日每日一读

吴恩达《Machine_Learning_Yearning》中文版 第13-16章误差分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24569
1.什么是误差分析?
2.误差分析有哪些作用?
3.是否可以人工分析误差?

文档:
区块链零基础入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24570



github深度学习的项目实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24572



疑问解答:
kafka source 反序列化问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24571





about云2018年05月28日每日一读


线路型:
区块链零基础学习线路
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24558
1.你对区块链了解多少?
2.区块链与大数据、云计算是什么关系?
3.区块链原理是什么?
4.区块链该如何学习?
5.区块链有哪些应用?
6.区块链与我们普通开发有什么区别和相同之处?


实操演练:
用Hive进行逆回购分析,实现余额宝背后的逻辑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24566
1.什么是逆回购?
2.怎样将csv数据导入Hive?
3.怎样用Hive统计股票每天每分钟的均价?




连载型:
Spark 高级分析:第六章第2,3节 解析和准备数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24565
1.从哪里获取数据?得到数据后存储在哪里?
2.文章中如何将XML转换成纯文本?
3
.XmlInputFormat是什么?



文档:
区块链【以太坊】开发环境搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24567



疑问解答:
在Spark中怎么实现对一个二维数组的读与写
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24564


一段JAVA代码不知道碾压多少小伙伴,请大神科普!!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24563


ubuntu下python2使用opencv
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24562





about云2018年05月25日每日一读


提高卷积神经网络(CNN)性能的几种手段
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24557

1. 什么是Pooling?

2. 什么是Dropout?

3. 为什么要使用Batch Normalization?

4. 数据增强的作用是什么呢?





总结型:
Spark和hadoop依赖冲突解决总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24556



小知识点:
spark之什么窄依赖、宽依赖
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24555


文档:
神经网络与深度学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24559



疑问解答:
在集群中,spark从hdfs中是怎么加快读取数据的,另外spark分区在集群中是怎么分布的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24554




about云2018年05月24日每日一读


连载型:
吴恩达《Machine_Learning_Yearning》中文版 第9、10、11章
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24550



书籍:
Keras快速上手:基于Python的深度学习实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24552


问答:
疑问解答
hadoop之MapReduce的问题,请求解答!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24548


MapReduce的警告
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24549


异常型
ResourceManager 启动失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24551




about云2018年05月23日每日一读

连载型:
TensorFlow ML cookbook 第三章4、5节 理解线性回归中的损失函数和实施戴明回归
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24541
1、如何理解线性回归中的损失函数?
2、什么是实施戴明回归?
3、学习率对L1和L2有哪些影响?
4、常规线性回归与戴明回归之间的区别有哪些?



文档:
基于深度学习的目标检测最新研究进展总结概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24546



小知识:
CatalogJanitor线程禁用,对集群有没有影响。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24540


spark多个任务,第一个任务的结果是第二个任务的输入
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24542


storm搭建普遍注意问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24545


异常错误:
org.apache.hive.service.cli.HiveSQLException: null
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24543


疑问解答:
如何通过代码统计spark在shuffle阶段所消耗的时间
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24544





about云2018年05月22日每日一读

连载型:
吴恩达《Machine_Learning_Yearning》中文版 第8章使用单值评估指标进行优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24536
1.多值评估指标为什么使使算法之间的优劣比较变得更加困难?
2.在多个分类器之间进行抉择时,什么方法可以更快的做出决定?



小知识点:
hbase过滤器汇总【查询汇总】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24537

名企资源:
docker名企企业应用18文档汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24534


问答:
异常错误:
SparkSession Error while instantiating 'org.apache.spark.sql.hive.HiveSession...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24533


方案探讨:
hbase rest_api 联合查询
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24535


疑问解答:
SparkSql thriftserver
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24538




about云2018年05月21日每日一读

连载型:
Spark 高级分析:第六章第1节 词语文档矩阵
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24525
1.什么是LSA?为什么需要LSA?
2.什么是SVD?
3.什么是词语文档矩阵?
4.什么是TF-IDF,有何作用,Spark中是否有其实现?


技术应用:
使用TensorFlow.js实现在浏览器中实时估计人体姿态
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24528
1.姿态估计有哪些用途?
2.怎样使用PoseNet进行姿态估计?
3.使用PoseNet进行单人姿态检测器的流程是怎样的?


如何使用机器学习匹配导师
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24523
1. 如何进行数据清洗?
2. 如何生成语料库?
3. 如何筛选重要特征?
4. 如何匹配得分和分配算法?



经典文章:
Presto 相关文章汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24530


文档:
数据挖掘十大算法详解(dm-algo-top10)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24531



异常错误:
hive-1.1.0-cdh5.9.3编译错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24529



hadoop-2.6.0-cdh5.9.5编译报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24526


kafka消费报认证错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24527




about云2018年05月18日每日一读

介绍解说:
美团点评数据平台Kerberos优化实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24522
1.什么是Kerberos ?
2.KDC原理是什么?

3.美团做了哪些优化?



文档
区块链技术指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24519


以太坊DApp开发环境搭建-Ubuntu
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24520


以太坊DApp开发环境搭建-windows
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24521


异常错误
openstack创建网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24518




about云2018年05月17日每日一读

深度型:
区块链系统入门【推荐】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24512
1.区块链包含了哪些核心技术?
2.区块链分为了几层?
3.区块链有哪些应用?


问题解答
你想知道区块链问题总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24513
1.区块链技术主要可以用在哪些行业?
2.金融领域为什么要使用区块链技术?有什么实质性的好处?
3.什么是比特币说的“挖矿”?
4.所有的区块链都需要挖矿吗?


连载型:
吴恩达《Machine_Learning_Yearning》中文版 第7章开发集和测试集应有多大?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24510
1.开发集的规模多大比较合适?
2.开发集规模如何检测出0.1%的差异?
3.测试集的大小又该如何确定?


公众号:
区块链社区HiBlock
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24511




英文资料:
通过Scikit-Learn&TensorFlow动手学习机器
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24514


问答:
HD
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24509



about云2018年05月16日每日一读

利用TensorFlow实现人声识别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24504
1、人声识别应用场景有哪些?
2、什么是梅尔倒频谱算法?
3、如何进行算法处理速度优化?
4、如何选择人声识别模型?




面试题:
大数据面试题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24506


文档:
HDFS多租户实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24507



问答:
pyspark 如何使用自定义的python程序和其他工具库
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24503


hbase rest api   scanner id的生存周期
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24505





about云2018年05月15日每日一读

吴恩达《Machine_Learning_Yearning》中文版 第6章开发集和测试集应该服从同一分布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24499
1.开发集和测试集该如何选择?
2.开发集和测试集的分布不同导致哪些问题?
3.如何才能选择开发集和测试集数据,让机器学习取得进展?



文档:

《架构师》特刊 用户画像实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24500





about云2018年05月14日每日一读

脉冲版的深度残差网络 Spiking ResNet 详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24494
1.什么是脉冲神经网络?
2.怎样构建脉冲残差网络?
3.脉冲残差网络有哪些特性?



吴恩达《Machine_Learning_Yearning》中文版 第5章开发集和测试集的概念
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24491
1.分类器(classifier)部署到移动应用中性能慢的原因是什么?
2.如何合理地设置开发集和测试集?


Spark 高级分析:第五章第11,12节 执行聚类
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24492
1.如何执行聚类?
2.如何解释分析结果

3.Spark畜类K-Means聚类外还有哪几种实现?

4.聚类除了异常检测还有哪些应用实例?



资源:
区块链原理、设计与应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24497


hive on  spark文档汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24496



问答:
flume+kafka+hdfs疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24493


kafka+SparkStreaming任务不断提交,却一直阻塞,求解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24495





about云2018年05月11日每日一读

吴恩达《Machine_Learning_Yearning》中文版 第1-4章
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24485
1. 为什么选择机器学习策略?
2. 如何使用本书帮助你的团队?
3. 规模驱动机器学习发展状况?


英文资料:

比特币:一种点对点电子现金系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24487


书籍:
鸟哥的Linux私房菜服务器篇(第三版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24488



问答:

sqoop hive数据导出到mysql 转换异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24486




about云2018年05月10日每日一读

以太坊智能合约开发2:实现区块链hello word
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24478
1.什么是Ganache?
2.为何安装Ganache?
3.Ganache有哪些特征?
4.如何实现Hello World智能合约?
5.实现Hello World智能合约包含哪些步骤?



名企资料:
为支撑高并发应用的kubernetes的性能优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24479


书籍:
自己动手做大数据系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24480




问答:

关于hadoop的一些疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24477


制作的Linux镜像SSH提示Server host key did not match the signature supplied
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24481


hive构建数据仓库的架构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24482


一个MR的面试题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24483




about云2018年05月09日每日一读

理解算法中激活函数的作用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24475
1、为什么需要激活函数?
2、激活函数都有哪些?
3、不同激活函数有哪些优缺点?
4、怎么选用激活函数?




以太坊智能合约开发1:IDE对solidity语法的支持及太坊相关概念
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24474
1.solidity是什么?
2.IntelliJ IDEA如何开发solidity?
3.智能合约是什么?




项目源码:
Swift for TensorFlow
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24471


多模态无监督图像转换
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24472

GluonNLP 自然语言
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24473



问答:
scala中的型变问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24469





about云2018年05月08日每日一读


NLP神器—Gensim使用实践及相关概念介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24462
1.什么是语料,向量?
2.Gensim使用本文包含了哪些步骤?
3.每个步骤分别完成什么事情?





外站经典:
Solr官方文档【中文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24463


名企资源:
阿里技术参考图册 - 研发篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24464



公众号:
zhisheng
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24465





about云2018年05月07日每日一读


深度卷积神经网络详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24456
1.多层神经网络结构是怎样的?
2.什么是卷积神经网络?
3.卷积神经网络中每一层处理操作的作用及意义是什么?



Spark 高级分析:第五章第9,10节 分类变量,使用标签和熵
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24449




资源失效反馈
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24455


功能源码:
大数据组件使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24457


文档:
Hive on Spark源码分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24460



问答:
hive使用spark引擎,设置yarn-cluster,同时只能有一个连接?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24451


CDH5.14.0 安装hive时,找不到部分表!!!!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24453


hbase api如何获取一张表的region个数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24458


如何关掉Cloudera quickStart-vm-5.13里面不需要的服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24459


scala的数据结构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24450




about云2018年05月04日每日一读

如何借助Lily HBase Indexer在solr中为HBase中的数据建立索引
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24447
1. 整个文件处理流程是怎样的?
2. 如何在Solr中建立collection?
3. 如何对Morphline 和 Lily Indexer 进行配置?
4. 如何批量建立全文索引?
5. 如何在Solr和Hue中验证?






公众号:
小小詹同学
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24445


名企资料:
阿里技术参考图册 - 算法篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24446




about云2018年05月03日每日一读
HBase 2.0版本正式发布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24438
1.HBase版本由哪三部分组成?
2.HBase的接口包含了哪两部分?
3.hbase2.0关键特性有哪些?




about云铁粉群
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24436


经典公众号:
大数据技术汇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24440

小知识分享:

cloudera实战宕机的该如何解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24441


spark rdd分区与任务的关系
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24442


英文资料:
短文本会话的神经响应机制
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24443



问答:
oozie coordinatorbu执行mapreduce报错JA017: Could not lookup launched hadoop
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24439





about云2018年05月02日每日一读


卷积神经网络笔记连载1——卷积神经网络基础
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24431
1.机器视觉(Computer Vision)问题包括哪些?
2.如何检测图片的边缘?
3.怎样利用CNN进行简单的数字识别?



TensorFlow ML cookbook 第三章1-3节 使用矩阵求逆方法、实现分解方法并学习张量流法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24424
1、如何使用矩阵求逆方法?
2、如何通过矩阵逆法获得的数据点和最佳拟合线?
3、如何实现分解方法?
4、如何学习回归的张量流法?




一分钟小知识:
spark sql和hive on spark的区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24432




问答:
HBase避免写热点发生rowkey设计的疑惑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24427


spark2.3 java.lang.NoSuchMethodError: io.netty.buffer.PooledByteBufAllocator....
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24429


Python  requests
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24426


新手问:hive on spark,设置spark.master的多种方式能多连接(session)么?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24430


HBase中的两个疑惑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24433


在线等!!!!CDH5.10集群搭建的问题!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24423









已有(1)人评论

跳转到指定楼层
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条