Spark-About云-梭伦科技-第2页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

求助，实习生，DStream 为什么foreach 没有执行，代码如下

//val kafkaStream1 = KafkaUtils.createStream(ssc, zks, group, topicmaptmp) println("---------------kafk ...

o13674976542 2019-1-4 3 4292
Spark Graphx java.lang.ArrayIndexOutOfBoundsException: -1

各位大神，最近在使用Spark Graphx做一些图相关计算，遇到了 java.lang.ArrayIndexOutOfBoundsException: -1问题，大概的异常信 ...

冰诺莫语 2018-12-29 3 7563
电商中最佳商品组合计算

现在有个数据表：店铺订单 sku详情(sku编号:数量) xxx旗舰店 ECO001 [SKU1:8,sku2:3,sku3:5] xxx旗舰店 ...

zhuqitian 2018-11-14 2 7760
spark-shell yarn-client模式启动异常问题

spark-shell yarn-client模式启动总是出现异常。运行环境如下： spark1.3 hadoop2.6 HA jdk1.8.0_31 spark-env.sh ...

cookeem 2015-3-31 12 259462
求一个大数据相关项目idea 作为毕业设计

感谢您，点进来，作为学校第一届大数据相关专业，导师对于毕业设计题目也没有什么眉头，请求各位探讨一些方案，离线的项目太过简 ...

o13674976542 2018-11-10 2 9619
RDD如何修改持久方式？

RDD默认持久方式是MEMORY_ONLY，无法通过persist进行修改持久方式，提示“Cannot change storage level of an RDD after it was ...

evababy 2017-3-22 7 15087
SparkStreaming 消费kafka数据异常

在尝试用sparkstreaming消费kafka topic数据时，在生产环境上编译发现程序卡住不执行。在虚拟机环境一切正常。代码如下： packa ...

ffwgod 2018-11-8 1 4680
spark sql启动的task数量和hbase 设置的numregion数量一致，如何自定义task数量

我是用hive+hbase+hadoop+spark 在使用spark sql执行语句的时候启动的task的数量与设置的hbase 的numregions是一致，并不是和had ...

tt_tt 2018-8-13 3 8121
同时输出多个orc文件

目的:一次读取很多不同的目录,每个目录生成不同的orc格式文件,输出到不同的目录下请教如何实现生成不同的orc格式文件输出到 ...

jinwensc 2018-9-12 5 5211
Spark报错：“WARN ObjectStore:568 - Failed to get database global_temp“

我已经配置好Spark2.3.1 使用hive1.2.2元数据，但是运行spark-shell时，经常会出现一个WARN。具体情况如下：==============Hive ...

Tesla 2018-9-13 2 24022
spark2.X 访问不到hive 数据库，求帮忙

我已经把hive-site.xml 扔到resource下面了

JQKA2 2018-8-23 4 5883
spark-submit 提交程序经常出现java.io.EOFException 错误

用spark-submit提交一个程序，如果数据量大一些就经常出现java.io.EOFException错误，数据小也会出现，但还是会执行成功，只要不 ...

ltne 2018-8-23 1 13629
spark-submit 提交python程序，运行出现module未发现

用spark-submit 提交python程序，里面需要引用pywt的module，现在集群每个节点的python环境都安装了pywt，每个节点运行python，i ...

ltne 2018-8-23 4 12938
spark streaming 报错

spark streaming 空跑有时候就报这个错，什么数据都不给传，有时候就会报这个错 16/05/12 19:10:53 WARN TaskSetManager: Lost ...

邓立辉 2016-5-12 2 13800
调试本地spark sql环境

1.准备hadoop环境 1.1 官网下载hadoop-2.7.3.tar.gz解压http://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/ ...

abc50319 2018-8-14 0 5371
sparksql 可以修改map数吗

sparksql 可以修改map数吗

ananan36 2015-12-9 7 21674
NoClassDefFoundError: org/apache/commons/configuration2/builder/fluent/Parame...

maven项目结构 Cloud ---common ---Analysis Analysis依赖了common项目，使用idea自带打包 Analysis可以找到 ...

希孟100 2018-8-9 3 7535
spark-sql load data inpath 提示Error in query: java.lang.IllegalArgumentExcep...

spark-sql --master yarn 启动spark-sql CREATE TABLE IF NOT EXISTS scalar_test ( id bigint, x double, y double, type int) ...

ltne 2018-8-8 1 5683
用spark-submit 提交任务之后，怎么监测任务的运行状态呢，运行了百分比和最后是否...

用spark-submit 提交任务之后，怎么监测任务的运行状态呢，运行了百分比和最后是否运行成功，在spark-submit提交之后会出现一些 ...

ltne 2018-7-27 3 21022
spark ClassNotFoundException

maven项目，语言用的scala,AnalysisSimulation模块依赖commons模块，打包之后运行报ClassNotFoundException: analysis.DangerLev ...

希孟100 2018-8-3 4 6036
spark ClassNotFoundException

maven项目，AnalysisSimulation模块依赖commons模块，打包之后运行报ClassNotFoundException: analysis.DangerLevelTop10肯定没 ...

希孟100 2018-8-2 4 5886
spark循环中的变量问题，，foreach里面向map填值，在循环外面值没有了

头大了。。。。。下面这个map在循环里面有值，到循环外的map里就没有值了。。。 object Test { def main(args: Array[Stri ...

未央不见 2018-7-29 5 24098
spark去读取hive数据，报空指针异常，求助。。。

spark去读取hive数据，报空指针异常； hive-site.xml是从集群上拷下来的，报错如下： 18/07/30 10:34:45 INFO Datasto ...

未央不见 2018-7-30 2 11936
Structured Streaming容错

我看官方文档说Structured Streaming是通过checkpoint和WAL来保证容错的，并且通过数据源的可重复消费以及幂等来保证端到端的exa ...

zstu 2018-7-25 2 5303
sparkstreaming消费kafka 多分区如何保证顺序

kafka的一个topic里面来了几条消息，sparkstreaming需要按照顺序处理，但是topic是有多个分区的，除了把这几条消息放到一个分区 ...

哦润吉 2018-7-19 5 22233
各位老师，我用breeze的pinv求矩阵伪逆，为什么结果是错的？

各位老师，我用breeze的pinv求矩阵伪逆，为什么结果是错的？下面是一段测试代码： package AE_LOC import breeze.linalg.{De ...

1601365 2018-7-14 6 7220
如何用spark生成Hfile 写入hbase （延伸）

val conf = HBaseConfiguration.create();val tableName = "data1" val table = new HTable(conf,tableName) conf.set(TableOu ...

remarkzhao 2018-2-27 18 15593
请教各位老师，文件操作出现问题！

使用spark开发程序，需要从大量如下格式的txt文本中读取数据，编写程序以后发现只能操作其中单个文本，操作多个文本时只操作了第 ...

1601365 2018-7-4 4 4459
KafkaUtils.createDirectStream参数报错

import kafka.api.OffsetRequest import org.apache.spark.SparkConf import org.apache.spark.SparkContext import org.apac ...

bottlevil 2018-7-3 4 18813
sparkstreaming多consumer消费kafka报错问题

版本： sparkstreaming 2.2 kafka 0.10sparkstreaming 集成kafka后（Direct模式），同一个groupid下的多个spark-streaming ...

qq824203453 2018-6-28 1 9955