Spark-About云-梭伦科技-第2页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

flume+spark结合的问题

结合时出现了问题，求大神告知。。。。。。。。。。在线等。。。通过sparkStreaming的拉模式拉去flume中的数据flume中的配置是 ...

fengfengda 2017-9-15 11 9749
sprakstreaming多个app同时运行资源问题

我之前测试验证的时候都是一个app把所有core都占用，现在我要很多个app同时跑，这样每个app占用的core就很少了。而且是这些app大 ...

dlh 2015-12-18 11 18286
spark连接mongodb 耗时特别长是什么原因啊

4台集群下，spark on yarn， 3 千万mongodb数据慢死估计1小时什么原因啊前辈们如何使用sparkSQL（spark）快速处理mongod ...

yisun123456 2017-10-17 11 14524
spark任务在spark-shell上能跑，但是在spark-submit上报错

请大神，帮我看看这个问题， 1.我自己写的WordCount在本地能跑，在spark-shell上能跑，但是在spark-submit上报错 2.排除scala ...

小小布衣 2015-1-8 11 147412
intellijidea 用scala写了个spark的demo报错求助

本人刚刚接触intellijidea这块今天写的代码报错，搞了半天也出问题，求大神给我指点一下。

jxlxxxmz 2017-7-27 11 8311
在linux平台下启动intellij idea 14 报错

linux下安装 Intellij idea 14 ，解压后启动报错。报错内容，Startup Error: Unable to detect graphics environment ...

轩辕依梦Q 2015-7-18 11 113519
安装IDEA，启动时出现错误，求大神解答，万分感谢!

如图，idea.sh时，提示错误，本人刚接触，不是很了解，希望大神们不吝赐教，万分感谢！

lwq 2016-2-26 11 29585
spark-submit参数的具体含义求解

我的机器 master: 3G centos7 slave1:3G centos slave2:3G ubuntu 我计算的是五亿条人口信息，版主连接 Spark SQL ...

SuperDove 2017-2-17 11 21681
如何定时清空sparkstreaming的统计结果，重新开始统计

需求：spark streaming kafka 通过 updateStateByKey 能定时统计出结果来，因为需要每天的0点需要重新统计结果。那么该如何将 ...

此名木有人用 2016-5-9 11 32991
通过eclipse 提交sc.textFile("XX").count() 报错

2017-07-31 16:28:08,364 INFO org.apache.spark.executor.CoarseGrainedExecutorBackend: Got assigned task 5 2017-07-31 16: ...

taoxw 2017-7-31 11 8811
sparkstreaming结果怎么和传入的数据关联上？

我用sparkstreaming对数据库里的数据做分析，然后输出分析结果。我之前测试验证都是用netcat输入查询条件，sparkstreamin ...

dlh 2015-12-7 10 24489
spark通过Filter过滤器读取Hbase数据报错

错误信息如下： org.apache.hadoop.hbase.DoNotRetryIOException: Failed after retry of OutOfOrderScannerNextException: was ...

高帝斯法则 2014-11-3 10 65637
hadoop程序转为Spark程序遇到的问题

现有简单的hadoop程序，想将其转为spark程序，对于hadoop的map函数的转换没有什么问题，但是对于reduce的转换却出现问题，本人使 ...

梦回三国 2014-12-3 10 24553
java版本如何将spark的处理结果存入mysql？

求大神指教一下

Hentai 2017-1-19 10 21513
如何利用Spark Streaming实现UV（有状态的）统计

背景需求: 基于实时的用户点击日志，计算出当天的pv、uv。 pv很好说了....UV这种需要按照用户唯一标识去重的如何计算呢？ ...

xingoo 2017-5-9 10 32693
用spark写数据到hbase

请问各位大神这是什么情况。。从网上看了一个例子用spark向hbase写数据抛出的异常：java.lang.IllegalArgumentExce ...

remarkzhao 2017-7-19 10 15410
Spark Streaming使用sortByKey报错NullPointerException

用Spark Streaming对数据进行处理时，使用了sortByKey进行排序，但报了一个NullPointerException异常 [mw_shl_code=java,true]u ...

zstu 2017-2-27 10 14996
用Spark读写Hbase出现Task not serializable

写了一个从Hbase中读数据处理后再保存回Hbase的程序，但是运行会出现Task not serializable报错代码如下： [mw_shl_code=scal ...

chimes298 2016-2-29 10 34259
【着急】windows下eclipse运行Java的Spark程序不进call方法如何解决？

windows下eclipse运行Java的Spark程序不进call方法如何解决？ [mw_shl_code=java,true]JavaPairRDD levels = hBaseRDD.mapToPai ...

Imagination 2016-4-29 10 11898
Spark写HBase报错

通过Spark向HBase添加记录，主要代码如下 String tableName = "test"; conf.set(TableOutputFormat.OUTPU ...

高帝斯法则 2014-10-22 10 31782
spark处理1亿行的数据耗时应为多少？

spark可以通过增加计算机数量来提高速度。我做了测试，单节点处理(1亿行*20字节/行)的文件用时27s，双节点用时19s，这是想要 ...

395455030 2016-1-19 10 61551
spark有什么方法在rdd的partition内部去重，而不是这个rdd内部去重

没找到对应方法，应该有人用过吧

邓立辉 2016-4-13 10 25332
如何用spark某些字段的回车去除

数据集如下； A字段，B字段，C字段 1，"","ddd" 2，"","cccc" 其中，B字段可能包含有回车符号，使得本来只有两行的数据变成 ...

linbowei 2016-10-18 10 13986
【求意见】如何使用spark streaming接收kafka中发送的自定义对象？

大家好，有个问题想咨询下，使用spark streaming无法接收kafka中自定义的对象，具体情况见下：环境：spark 1.3.1， kafka 0.8. ...

Cherise 2015-5-29 10 68754
Spark提交helloworld到yarn上的报错

如图：

sinv2015 2017-4-9 9 9891
还是关于导入hbase的问题。。

如何从sqlserver里把数据导入到hbase里，这个问题纠结了我一个月，各种方法的取舍，以及判断还是有点迷糊，目前想尝试以下方法 ...

remarkzhao 2017-8-28 9 5798
怎么统计SparkStreaming在数据上的运行时间（linux没有图形界面）

在Linux服务器上跑了一个SparkStreaming程序，需要统计程序在数据集上的运行时间，可是linux没有图形化界面，没法查看网页UI界面 ...

星语心愿 2018-4-15 9 11420
spark分布式处理同一个文件的问题

应用场景：间隔一个时间段来一次数据，使用spark做数据的清洗。有效数据写到hive表中，但是有一部分数据只有开始，结束 ...

liuzhixin137 2016-6-15 9 14875
Spark Scala急求

怎们用Scala 编写一个通过时间找到对应的ip..........,然后按时间排序

逆光之处是快乐 2017-11-24 9 4388
spark查询不了hive的orc格式的表

hive上的表t2，信息如下： spark-sql> desc formatted t2; OK 16/09/05 09:58:57 WARN LazyStruct: Extra bytes detected at ...

linbowei 2016-9-5 9 37306