Spark-About云-梭伦科技-第7页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

编译spark后运行spark-shell和spark sql报错

为了hive on spark，重新编译了spark-without-hive，按照hive官网上的编译命令：make-distribution.sh --name"hadoop2-without-h ...

Fortitude 2016-6-2 5 14541
$Spark求助搜狗实验数据划分split（“\t"）错误。$

Spark求助搜狗实验数据划分split（“\t"）错误。

spark小白，我用的sogo查询资料库，var rdd2=rdd1.map（_.split("\t")）为啥第四个数据和第五个没法用，隔开啊求助~求助 ...

xuekai 2016-4-10 5 8850
Spark submit遇到问题

Stack trace: ExitCodeException exitCode=10: at org.apache.hadoop.util.Shell.runCommand(Shell.java:538) at org.apach ...

rilweic 2016-4-11 5 30143
在Spark中怎么实现对一个二维数组的读与写

在spark编程中，遇到了一个问题，需要对一个二维数组进行读写操作，那么怎么才能实现像广播变量和累加器类似的功能呢？

星语心愿 2018-5-25 5 9988
如何通过代码统计spark在shuffle阶段所消耗的时间

现在有一个问题，就是统计shuffle阶段消耗的时间占程序运行总时间的百分比，可是怎么通过代码实现统计shuffle阶段消耗的时间呢？ ...

星语心愿 2018-5-22 5 6596
saveAsTextFile 这个函数有问题。。求教啊。。

import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ import org.apache.spark.SparkConf objec ...

dsy198816 2017-2-6 5 19074
spark saveastextfile 完后会自动生成文件名part-00000--part-0n ,怎么自定义名称呢？

spark saveastextfile 执行结束后会自动生成文件名part-00000--part-0n ,怎么自定义名称呢？谢谢

SSHSad 2016-5-5 5 39922
sparkstreaming消费kafka 多分区如何保证顺序

kafka的一个topic里面来了几条消息，sparkstreaming需要按照顺序处理，但是topic是有多个分区的，除了把这几条消息放到一个分区 ...

哦润吉 2018-7-19 5 22271
Spark -----HDFS

我上传文件了，在hdfs上，在IDEA跑时，他说HDFS路径不存在

逆光之处是快乐 2017-10-26 5 4978
Spark 源代码编译出现错误（和Mllib相关）

因为在用Spark 的Mllib我在LinearRegression.scala文件的头部加上了 import org.apache.spark.internal.Logging 来打印里面的 ...

bingoogle 2017-8-4 5 6444
如何使用RDD的转换去分析复杂一点的数据类型

接上一贴 id, ip, version ：有效数据有效数据 36271934 ...

liuzhixin137 2016-5-26 5 6827
spark循环中的变量问题，，foreach里面向map填值，在循环外面值没有了

头大了。。。。。下面这个map在循环里面有值，到循环外的map里就没有值了。。。 object Test { def main(args: Array[Stri ...

未央不见 2018-7-29 5 24271
启动spark-shell一直产生ERROR TaskSchedulerImpl: Lost an executor 27 (already ...

spark-shell进入后，一直出现下列日志，不知道怎么回事，请大牛给讲解下。 scala> 14/12/18 14:48:39 INFO SparkDeploySchedu ...

唐运 2014-12-18 5 57210
请问有没有人做过spark的性能测试

主要是I/O，磁盘之类的

lsy1996 2017-3-9 5 11354
为啥 sparksql行而seq join就不行。。

各位大佬： DC_DIAGNOSISDF(263 MB) DC_LAB_RESULT_MASTERDF(899.04 MB) DC_ENCOUNTERDF(1.75 GB) DC_VITAL_S ...

remarkzhao 2017-8-17 5 10985
SparkStreaming怎么处理失败的Batch

在使用SparkStreaming+Kafka+Redis做一个实时的需求。测试的过程中遇到以下的问题用DirectStream读取kafka，数据经过处理后for ...

erbin 2017-9-12 5 8170
spark on yarn 提交到集群运行报错

环境为hadoop HA集群，yun01-nn-01、 yun01-nn-02为namenode,状态分别是ACTIVE和STANDBY，如下运行： bin/spark-submit --maste ...

xw2016 2016-6-10 5 13031
spark读取parquet文件

spark2.10.6 用newHadoopFile来读取parquet文件 val rdd = sc.newHadoopFile(path,classOf],classOf[Void],classOf[String]) ...

macWang 2017-6-27 5 10092
structured streaming如何计算每小时新增用户数

我想实时统计一个app系统的每个页面每小时的新增用户数并保存到hbase表中，有什么好的方法可以减少对于hbase表的请求？

zhouyan8603 2017-9-8 4 7430
求助SparkSQL的优化

我的SparkSQL计算10G以内的数据，速度比Hive慢好多，理论上不是应该更快吗，就算数据量小，是不是也应该速度差不多嘛？执行语 ...

yangyixin 2017-9-15 4 6127
spark开发环境搭建，如何找到spark-assembly-1.3.0-hadoop2.5.0-cdh5.3.0.jar

spark开发环境搭建，如何找到spark-assembly-1.3.0-hadoop2.5.0-cdh5.3.0.jar

arsenduan 2015-3-31 4 212197
任务运行几分钟后为什么有几个executors dead状态？

--master yarn --deploy-mode client --driver-memory 8g --executor-memory 8g --executor-cores 5 五个节点，三个dat ...

mjjian0 2017-9-30 4 15852
spark监控hdfs新增文件在sparkStreaming程序中能否得到这个文件的...

spark监控hdfs的时候，在hdfs中新增文件，在sparkStreaming程序代码中能否得到这个新增文件的路径，应该如何获取这个路径？

fengfengda 2017-10-12 4 6047
Spark mllib数据怎么转换的问题

如题：Spark mllib在做模型训练的时候，数据一般都是 double型的，而我们大多数的数据都是String 举例说明：比如我现在要用贝叶 ...

guxingyu 2017-3-31 4 6602
spark怎么进行数据挖掘

spark怎么进行数据挖掘，谢谢大家

yyjjss 2017-10-16 4 5866
用IDEA打包scala程序出现问题

我写了一个spark的小程序，用的是IDEA自带的打包功能，结果出现这种内存溢出错误：Error:Artifact 'xxx:jar': java.lang.OutOfMe ...

seraph50 2016-1-4 4 16379
spark DataFrame遇到的问题，求大神解答

我的需求是: 取出DataFrame中的某行某列的位置上的数据。 [mw_shl_code=java,true]JavaSparkContext sc = new JavaSparkContex ...

duliming 2016-1-15 4 12876
执行DataFrame.count的时候遇到的问题，求大神帮忙

我再这行DataFrame之前做个多次unionAll操作。这个count的DataFrame是经过多次unionAll出来的一个DataFrame。请问为什么会 ...

duliming 2016-1-20 4 9917
如何在java中创建SparkSession对象。。

各位大神：我要在java中读取sqlserver里的表，然后对hbase进行循环插入这是我的代码但是一运行就出这 ...

remarkzhao 2017-9-13 4 6690
spark Phoenix

我用Phoenix存储spark计算的结果，在本地local模式下运行可以，但我用spark-submit提交到集群运行后，spark-submit --class com. ...

zstu 2016-10-24 4 16038