Spark-About云-梭伦科技-第9页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

Spark mllib数据怎么转换的问题

如题：Spark mllib在做模型训练的时候，数据一般都是 double型的，而我们大多数的数据都是String 举例说明：比如我现在要用贝叶 ...

guxingyu 2017-3-31 4 6604
关于spark执行器内存分配的问题

本人在试验过程中发现，为Executor分配更大内存（不超过每个节点总内存的75%），会报OOM错误，但是内存分配更小时反而正常运行。 ...

chimes298 2016-3-25 4 12676
spark on yarn 的配置疑问

spark在yarn模式下，若在spark-env.sh中加入了如下的配置 [mw_shl_code=xml,true] export SPARK_EXECUTOR_MEMORY=1000m exp ...

grinsky 2016-3-25 4 6245
关于spark的core数

我的服务器本身是2核的，如果我将spark-env.sh 里面的SPARK_WORKER_CORES设为5了，我也能在web页面上看到确实给这个节点分 ...

UFO 2016-3-30 4 8710
新手求助该如何实现这个简单的逻辑？

下面是我要处理的日志，每个元素以|分开，最后的元素是域名，我要统计每个域名有多少条日志。 49|17825793|2887524685|0|303058 ...

dsy198816 2017-2-5 4 9762
碰到scala的一个奇怪的问题，请大家帮忙看看

[mw_shl_code=scala,true]def main(args : Array[String]) : Unit = { var test : Map[String, String] = Map() te ...

liuzhixin137 2016-6-2 4 6038
新手求助，刚开始编写程序，出现application does not take parameters错误

跪求大神们带领小渣渣入门spark。编写应用程序时候使用的是parallellize方法，传入的对象明明是List（Vector）类型的，但是在指 ...

1601365 2018-3-13 4 10224
关于LOF(局部异常因子)的问题,请教各位大神，感激不尽！

请问各位叔叔阿姨大哥大姐，怎么在spark中实现LOF(局部异常因子)的计算？，我在网上看到的是“new LOF()”，通过导入操作import ...

1601365 2018-6-2 4 6430
spark启动后没有work进程

如上图启动后没有work进程，什么原因呢？ spark-env.sh配置如下： export JAVA_HOME=/application/hadoop/jdk export SC ...

xw2016 2016-5-27 4 12468
怎么测试spark是否成功

运行spark自带示例没报错，但在web界面看不到效果？还有其它方法验证吗？或者谁发个程序来测试下？

xw2016 2016-5-28 4 8370
对于Pair RDD 如何对数据进行排序？

我知道key排序用sortbykey 数据value排序用啥呢？我现在的rdd里数据如下。 (file.baixing.net,3) (60.167.59.160,3) h ...

dsy198816 2017-2-6 4 8755
spark-shell 执行代码报错

spark-shell 执行代码val rdd2=rdd1.flatMap(_.split(" ")).map(x=>(x,1)).reduceByKey(_+_) 报错： org.apache.hadoop.ipc. ...

xw2016 2016-5-30 4 7380
远程连接不上

拜托！拜托！哪位大神能帮我解决如下所述问题: 我的远程shell连接不上虚拟机了，但我看了看防火墙关着呢，ssh服务正常(并且我还 ...

连成呀 2017-7-31 4 4762
spark standalone 没有结果这是什么情况。。

各位大神额，这是我在windows下用idea写的。 import org.apache.spark._ object WordCount { def main(args: Array[Stri ...

remarkzhao 2017-8-3 4 5998
spark读取hbase大数据报错

有10亿的测试数据分别存储在hdfs和hbase，想试下用spark测试下对两种存储方式下spark数据分析的性能，hdfs的没问题，但是读取hba ...

scorpionxie 2017-2-20 4 7749
Structured Streaming Kafka Offset

hi，想问一下大家有用过Structured Streaming消费kafka数据吗？它能自己管理kafka offset吗？

zstu 2018-6-28 4 8369
spark ClassNotFoundException

maven项目，AnalysisSimulation模块依赖commons模块，打包之后运行报ClassNotFoundException: analysis.DangerLevelTop10肯定没 ...

希孟100 2018-8-2 4 5901
求助spark

现在做一个spark数据存取优化的课题，请问要搭建哪种模式来做。

lsy1996 2017-2-20 4 6407
请教spark-sql的问题

我代码执行如下： [mw_shl_code=scala,true] val sparkConf = new SparkConf().setAppName("FemaleInfo") val sc = new ...

Wyy_Ck 2017-2-25 4 5805
Eclipse向Spark集群提交任务时找不到主类

刚接触Spark想用Java先练练手。集群是CentOS6.5，装的是CDH5.0.1，里面的spark版本是0.9.0 现在在windows系统上用eclipse向集 ...

alu1105 2016-6-13 4 16715
请教，基于用户浏览情况如何计算用户相似度

近日有一个需求：读取HBase数据库的用户行为数据表，根据用户的浏览书籍数据，计算用户相似度，然后根据用户相似度进 ...

听太阳说话 2018-6-5 4 10925
A master URL must be set in your configuration错误

在运行spark的测试程序SparkPi时，点击运行，出现了如下错误： Exception in thread "main" org.apache.spark.SparkException: ...

arsenduan 2015-4-11 4 98074
spark 单机运行成功，如何使用or测试？

查看集群环境 http://master:8080/ 访问正常进入spark-shell $spark-shell 执行正常如下图查看jobs等信息 ...

释怀 2016-8-1 4 18706
假如spark streaming异常退出，该如何去做容错？

大家好。我现在的应用场景是 kafka+ spark streaming 近实时处理数据。 spark streaming处理的数据是近两个小时的数 ...

liuzhixin137 2016-8-25 4 15524
spark监控hdfs新增文件在sparkStreaming程序中能否得到这个文件的...

spark监控hdfs的时候，在hdfs中新增文件，在sparkStreaming程序代码中能否得到这个新增文件的路径，应该如何获取这个路径？

fengfengda 2017-10-12 4 6048
spark-sql 支持insert into吗

执行spark-sql创建好表后执行insert语句报错 Unsupported language features in query: INSERT INTO Persons VALUES ('Gate ...

Wyy_Ck 2017-3-7 4 24243
spark Phoenix

我用Phoenix存储spark计算的结果，在本地local模式下运行可以，但我用spark-submit提交到集群运行后，spark-submit --class com. ...

zstu 2016-10-24 4 16039
spark集群启动错误

我搭建spark集群时,在master上 ./start-all.sh,发现一个slave节点起不来,一个slave节点能起来;错误如下Spark Command: /usr/java ...

wangzhenqiang 2016-11-2 4 6780
./pyspark出现的错误

[wxj@elephant bin]$ ./pyspark /usr/local/lib/python3.4/site-packages/IPython/core/history.py:226: UserWarning: IPython ...

smfswxj 2017-11-12 4 13200
大数据集如何转化为RDD

本人小白，求助大神！本人在将单机板的计算程序改写成分布式spark计算程序，由于我的程序需要根据数据集前后两条数据关系进行 ...

AaronCheung 2017-11-24 4 7411