用户组:游客
问题导读 1.通过什么菜单项可以导入源码? 2.打jar包需要哪些步骤? 3.如何找到jar生成路径? 上一篇: about云日志 ...
问题导读 1.IntelliJ IDEA是否可以直接创建Scala工程? 2.IntelliJ IDEA安装,需要安装哪些软件? 3.IntelliJ IDEA如何安装 ...
问题导读 1、什么是DStream转换? 2、什么是窗口计算? 3、怎样最有效的将发生数据到外部系统? 本文接前篇: Sp ...
问题导读 1、什么是Spark Streaming? 2、如何创建StreamingContext对象? 3、什么是高级源? 本文接前篇: Spar ...
本帖最后由 pig2 于 2017-2-20 09:55 编辑 问题导读 1.spark有哪两个分支? 2.spark运行架构是什么? 3.spark包含哪四 ...
本帖最后由 howtodown 于 2015-3-31 19:42 编辑 问题导读 1.sqlContext.cacheTable("tableName")与sqlContext.uncacheTable ...
问题导读 1.Spark是什么? 2.如何理解Spark? 3.Spark扩展了MapReduce的哪些方面? 4.Spark可与Hadoop生态系统哪些组件集成 ...
问题导读 1.spark有哪些使用场景? 2.spark有包含哪些组件? 3.spark在哪些厂商已经应用? 4.spark如何实现地震检测? ...
本帖最后由 pig2 于 2017-2-15 16:52 编辑 问题导读 1.为什么会产生spark sql 2.sparkSQL包含哪些内容? 3.spark运行框架 ...
本帖最后由 pig2 于 2017-12-15 18:11 编辑 问题导读 1.dataframe如何保存格式为parquet的文件? 2.在读取csv文件中,如何设 ...
问题导读 1.在Hive on Spark设计原则是什么? 2.Hive on Spark,hive,Spark都做了哪些修改? 3.在Hive on Spark下,表格 ...
本帖最后由 desehawk 于 2018-4-16 21:39 编辑 问题导读 1.enable.auto.commit属性的作用是什么? 2.Offsests可以存储在哪 ...
问题导读: 1.kafka 0.10有哪些更新?2.怎样实现Executor端缓存消费者?3.kafka 0.10在提高可靠性方面做了哪些改进? ...
问题导读 1.Spark 如何访问集群? 2.有哪几种方式创建 RDDs? 概论在高层中,每个 Spark 应用程序都由一 ...
问题导读 1.如何进入spark shell? 2.spark shell中如何加载外部文件? 3.spark中读取文件后做了哪些操作? about ...
问题导读 1.读取日志的过程中,发生异常本文是如何解决的? 2.读取后,如何过滤异常的记录? 3.如何实现统计点击最高的记录 ...
问题导读 1.如何从所有数据中,抽取样本查看? 2.如何保存结果到hdfs? 3.saveAsTextFile的作用是什么? 上一篇 ...
问题导读 1.在url中,如何过滤不需要的内容? 2.如何获取404记录并且获取字段? 3.获取不能访问url列表的思路是什么? ...
问题导读 1.如何统计网站总的点击量? 2.如何实现统计不能访问网页的个数? 3.文章中如何定义和使用Scala函数的? ...
问题导读 1.自定义包,本文放到哪个路径下面? 2.复制包之后,需要做哪些权限操作? 3.如何验证导入是否成功? ...
问题导读 1.数据科学项目的第一步是什么? 2.Spark是用什么语言编写的?是否可以使用R/Python调用Spark? 3.哪些做法能使你更 ...
本帖最后由 xzc0202 于 2017-9-15 09:16 编辑 问题向导: (1)Spark机器学习库是什么,目标是什么? (2)MLlib具体提供哪些功能 ...
问题导读 1.添加开发包有几种方式? 2.使用sbt可能存在什么问题? 3.spark streaming开发需要了解哪些开发知识? ...
本帖最后由 pig2 于 2017-8-24 22:01 编辑 问题导读 1.如何使用IntelliJ IDEA创建sbt项目? 2.sbt项目需要做哪些设置,才 ...
本帖最后由 pig2 于 2017-8-24 22:01 编辑 问题导读 1.sbt在IntelliJ IDEA里面比较慢,该如何解决? 2.如何在window里面更 ...
问题导读: 1.怎样训练模型? 2.怎样使用模型?3.怎样进行模型效果评估? 上一篇:Spark机器学习入门2·准 ...
问题导读 1、什么是SparkContext? 2、如何配置Parquet? 3、如何高效的从Apache Hive中读出和写入数据? 本 ...
问题导读 1、怎样用Spark快速运行一个例子? 2、如何理解lines变量? 3、如何在NetworkWordCount中找到完整列子? ...
问题导读 1、如何持久化流数据到内存中? 2、什么是Checkpointing? 3、如何监控应用程序? 本文接前篇: Spark ...
本帖最后由 pig2 于 2017-2-21 09:48 编辑 问题导读 1.hive/console的作用是什么? 2.hive/console如何安装? 3.hive/con ...
本版积分规则 发表帖子
查看 »