用户组:游客
问题导读: 1、yarn有哪些界面?功能是什么? 2、如何解决数据倾斜? 3、如何处理小文件过多问题? 4、如何解决笛卡尔积/数 ...
本帖最后由 levycui 于 2021-1-20 20:13 编辑 问题导读: 1、如何理解CBO基本原理? 2、如何阅读Spark CBO源码实现? 3、Sp ...
问题导读: 1、如何使用spark进行文本数据预处理? 2、如何进行数据处理模型训练、保存和调用? 3、如何进行多分类模型训练和 ...
问题导读: 1.常用的推荐算法有哪些?2.推荐系统是什么样的流程?3.从这个推荐系统我们能学到什么? 推荐算法就是利用用 ...
问题导读: 1.公安实时运维平台整体架构是怎样的?2.Logstash有哪些作用?3.Spark处理分析分为哪几步? 公安行 ...
问题导读: 1.怎样对iOS的Crash Log进行符号化处理? 2.怎样解决ES的写入瓶颈问题?3.怎样做到高性能和可扩展? ...
本帖最后由 desehawk 于 2016-11-18 12:12 编辑 问题导读 1.本文的环境包含哪些软件? 2.如何安装开发环境? 3.提交源码 ...
问题导读: 1.如何用Hadoop的FileSystem实现在已有目录下用一个文件保存Spark数据?2.如何分块读取RDD数据并保存到hdfs?3. ...
本帖最后由 Oner 于 2017-6-29 16:50 编辑 问题导读: 1. 什么是ETL? 2. 使用Spark开发ETL系统有哪些优势? 3. 如何使 ...
本帖最后由 Oner 于 2016-11-10 07:53 编辑 问题导读:1. 使用Direct API时为什么需要见offset保存到Zookeeper中? 2. 如何将 ...
问题导读: 1.Spark在机器学习算法的实现上有哪些问题?2.Spark on Angel是如何解决Spark在机器学习任务中遇到的瓶颈?3.Spa ...
问题导读: 1.怎样把不同天的数据分离导入到不同天的es索引里面?2.有哪几种方式可以不同天的数据分离导入到不同天的es索引 ...
问题导读: 1. 为什么要建设大数据平台? 2. 大数据平台的业务架构有哪几块? 3. 数据可视化的原因是什么? 4. 数据可视 ...
问题导读 1、如何理解Spark技术的运用? 2、百度开放云BMR有哪些技术运用? 3、如何看待Enhanced in-memory columnar storage ...
本帖最后由 howtodown 于 2016-11-24 09:58 编辑 问题导读: 1. 使用什么样的数据集来进行预测? 2. 使用哪些工具与技术去 ...
本帖最后由 丫丫 于 2016-10-21 22:46 编辑 问题导读 1、如何定义图数据? 2、图数据分析与传统数据的处理有哪些不同之处? ...
问题导读: 1.什么是社区发现?2.什么是FastUnfolding算法?3.怎样实现FastUnfolding算法的分布式? 现实生活中存在各 ...
问题导读 1.spark是否兼容批处理和流式处理? 2.配置垃圾收集器时,主要有哪两种策略? 3.GC算法原理是什么? 4.spark如何根 ...
问题导读: 1.新浪微博的三层架构是怎样的?2.新浪微博的Feed使用场景?3.新浪微博的Feed是怎样排序的? 一、新浪微博 ...
问题导读 1、怎样部署在程序中调用spark服务的环境? 2、在程序中IDE中远程调用服务,需要做哪些配置? 3、JavaSparkContext ...
问题导读 1.Spark与Map/Reduce有哪些区别? 2.Spark处理数据的过程是怎样的? 3.Spark有哪些优势? 摘要:Tri ...
问题导读 1、怎么利用Memory Management和Binary Processing来提升性能? 2、apark怎么合理的利用Cache-aware computation? ...
本帖最后由 nettman 于 2015-3-31 16:12 编辑 问题导读 1.如何加大IDEA的启动内存? 2.IDEA会生成大量的缓存文件,如何修改 ...
本帖最后由 rsgg03 于 2015-3-25 17:25 编辑 问题导读 1.腾讯如何使用Spark 技术的?带来了哪些好处? 2.Spark 技术最适用 ...
问题导读:1. Spark vs MapReduce 有哪些优势?2.Spark有哪些成功应用案例?3.与Hive相比,Shark有哪些特性? Spark ...
本版积分规则 发表帖子
查看 »