用户组:游客
本帖最后由 a87758133 于 2019-6-13 21:02 编辑 问题导读: 1、基本的数据类型如何处理? 2、复杂的数据类型如何处理? ...
Normalizer Normalizer是一个Transformer,它使用p-norm范数对数据集进行正则化,默认p的取值为2,借助Normalizer可以标准化输 ...
问题导读 1.spark SQL命令可以通过什么窗口直接执行? 2.如何远程访问spark SQL数据? 3.你认为使用spark SQL的方式有哪些 ...
问题导读 1.spark SQL与传统数据库的区别在什么地方? 2.spark SQL独立使用,是否还需要hive? 3.Spark SQL都可以读取哪些 ...
问题导读 1.map能否直接排序? 2.如何转换,才能排序? 3.排序结果可以存储在哪两个集合中? 4._*如何使用? 5.排序函数 ...
在启动spark shell的时候,产生如下错误 [mw_shl_code=bash,true]Caused by: java.sql.SQLException: Failed to start datab ...
问题导读: 1.什么是线性回归算法? 2.线性回归代码示例? 3.如何在本地跑spark mllib的线性回归算法? 4.线性回归结果如 ...
本帖最后由 levycui 于 2017-2-14 15:04 编辑 问题导读: 1、如何使用IDEA打包jar文件? 2、如何使用spark-submit提交任务? ...
spark-avro是一个开源的建立在SparkSQL之上的免费开源插件。github地址:https://github.com/databricks/spark-avro.git ...
本帖最后由 Oner 于 2016-7-1 01:28 编辑 问题导读: 1. Spark开发调优常见的有哪几个原则?如何使用? 2. Spark作业运行的 ...
问题导读: 1.数据峰值有什么影响? 2.如何限制Spark的接收速度? 一:数据峰值的巨大影响 1. 数据确实不稳定,例如 ...
本帖最后由 不会飞的小凯凯 于 2016-4-22 20:25 编辑 问题导读: 1.RDD本质是什么? 2.shuffle本质是什么? 3.为什么spark容 ...
本帖最后由 eying 于 2015-10-21 16:10 编辑 问题导读: 1.Spark 1.5.0运程调试的过程? 2.安装调试前需要的事情 ...
本版积分规则 发表帖子
查看 »