Spark-About云-梭伦科技-第4页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

Spark on YARN失败是如何分析问题及解决的

本帖最后由丫丫于 2016-12-26 16:00 编辑问题导航 1、localizedPath是怎么得到的呢？ 2、distribute函数里面的参数，分 ...

丫丫 2016-12-26 0 13448
sparkStreaming中的textFileStrem()读取数据问题

sparkStreaming中的textFileStrem()监控一个目录，需要使用inputStream数据流（如java的BufferWriter、liux下的mv命令等）向监控 ...

星语心愿 2018-1-29 2 4760
Spark local -kafk求救

在Spark 程序中怎们能消除kafka自带的log4j的INFO的信息？？？？？，网上查的很多都试过了现在就是想在Spark local程序中消除I ...

zzjThebest 2018-1-8 3 5831
spark运行日志报错，总是运行一段时间报错。但是我没使用广播变量

这是我在运行spark报的一个错误。总是运行一段时间之后就报错了，请问大家是哪的问题？有人说数据处理不过来，望大神帮助， 1 ...

lukexi 2018-1-19 6 4930
spark streaming读取kafka数据游标offset错误

使用ambari2.6.1.0-129版本搭建环境。ambari 2.6.1.0 java openjdk version "1.8.0_141" spark 2.1.1 kafka 0.10.1.1 使用 ...

aurae 2018-1-22 2 9981
Spark Streaming中读取本地文件，无法获取数据

/** * Created by Administrator on 2016/9/24 0024. */ package com.keduo import java.util.Properties import o ...

txknick 2016-10-22 18 42768
Spark Streaming中的ssc.textFileStream()，获取不到数据

通过Spark Streaming获取不到HDFS上面的数据， val conf = new SparkConf().setMaster("local").setAppName("RDDTest"); v ...

guxingyu 2016-3-3 12 61523
统计热点数据并预测

业务需求：现有一个用户访问系统数据的数据集，因为系统硬盘承载能力有限，想根据数据集统计出用户访问的热点数据，将热点数据存 ...

pandatyut 2017-6-19 4 7421
Spark DataFrame show

val rdd = sc.textFile("..").map(x => x.split(",")).map(x => (x(0), x(1).toLong)) val df = rdd.toDF df.show df.cache ...

zstu 2018-1-16 7 6203
spark消费kafka数据手动维护offset

scala代码 package org.apache.spark.test import kafka.serializer.StringDecoder import kafka.common.TopicAndPartiti ...

liuyuze_hanbing 2018-1-12 0 8035
Spark on hive

Spark sql 读取hive 里的数据为什么可以连上Spark 集群，但是读取不了hive里面的数据？？？？？？？？

zzjThebest 2018-1-11 4 5053
Spark使用mllib进行机器学习执行时间较长

这个是较长时间的数据，对比时间较短的数据在task上没有出现数据不均匀的情况，只是在各个executor节点上的数据出现不均 ...

tjmikezhao 2017-12-28 1 4645
[求助]Spark读取数据问题

问题1：java 从各种数据源如mysql es读取表数据转换成 Map保存在内存l中这个数据怎么转换为rdd

kennys 2017-12-27 1 3812
spark job history 显示的时间不正确

spark job history 显示的时间不正确，如图，大家知道是什么原因吗，有什么解决方案吗？大神求解答

ltne 2016-12-12 5 8377
求助 rdd.saveAsNewAPIHadoopFile 的一个奇怪问题

额这个问题个人感觉好奇怪，可能又是我哪里疏漏了什么如上图，这个时候rdd.saveAsNewAPIHadoopFile时没问题的，但在执行时 ...

grinsky 2017-12-22 5 14285
Dstream 无reducebykey方法

spark版本2.2 在处理spark kafka streaming时，需要用到reducebykey时，发现居然没有这个方法…… 加了import org.apache.sp ...

grinsky 2017-12-21 3 6904
spark中数组共享的问题

在spark中，设置多分区，多分区里的数据并行处理，并且需要并行地访问共享数组和修改数组里的数据。在spark中这个共享数组该怎么 ...

星语心愿 2017-12-19 2 8827
spark-shell读取文件遇到错误

进入spark-shell正常，但是在执行 spark.read.json("/people.json") 报错如下 [mw_shl_code=bash,true]WARN scheduler.TaskSc ...

pig2 2017-12-13 0 3721
spark拆分数据

spark 在拆分数据是遇见有多颗分割符这种情况怎么拆分数据，比如说分隔符各有（，| /）这些

smfswxj 2017-12-11 1 6630
请大神指点，持久化到MySql中 VoidFunction报错

wordcounts.foreachRDD(new VoidFunction (){ private static final long serialVersionUID = 1L; @Override p ...

阿里云 2017-12-8 4 5268
sparkStreaming读取sqlserver，然后把读出来的数据插入到hbase

弱弱请教以下各位大神：我现在有个场景，sqlserver里的数据每时每刻都在增加，现在想用sparkstreaming把增量的数据读 ...

remarkzhao 2017-10-31 7 15940
使用pyspark Accumulator

怎么利用pyspark累加器 accumulator统计文档中访问jpg元素日志行出现的次数，最好有具体步骤，刚学不知道该怎么使用。

smfswxj 2017-12-5 1 6286
spark数据清洗问题

用什么函数可以是的kbdoc-00001只对应一个值了

smfswxj 2017-12-2 3 6380
hive UDF

原数据:(NaNNaNNaN234443,iptv7710679406) (NaNNaNNaN234141,iptv7810273420) (NaNNaNNaN233922,iptv7710682349) (NaNNaNNaN2 ...

逆光之处是快乐 2017-11-29 4 4344
spark任务执行的时候jar包的加载顺序问题

是这样的，项目中用的scala写的spark任务，有用到json与map互转，找到了一个工具：play-json，这个工具是scala写的。项目本地 ...

mjjian0 2016-12-9 4 23210
有谁知道 about云日志分析项目的日志文件数据在哪找

在做数据清洗的时候，在论坛了找了好久数据没有找到，哪个同仁可以告诉我地址，或者发给我一份，不胜感激。是《about云日志清 ...

xiaotainge 2017-11-29 2 4614
spark查询不了hive的orc格式的表

hive上的表t2，信息如下： spark-sql> desc formatted t2; OK 16/09/05 09:58:57 WARN LazyStruct: Extra bytes detected at ...

linbowei 2016-9-5 9 37281
Spark Scala急求

怎们用Scala 编写一个通过时间找到对应的ip..........,然后按时间排序

逆光之处是快乐 2017-11-24 9 4376
大数据集如何转化为RDD

本人小白，求助大神！本人在将单机板的计算程序改写成分布式spark计算程序，由于我的程序需要根据数据集前后两条数据关系进行 ...

AaronCheung 2017-11-24 4 7407
java.lang.NoSuchFieldError: defaultVal

大家好，我在spark 1.3环境编程时，遇到下述错误原因： Exception in thread "main" java.lang.NoSuchFieldError: defaultVal ...

xiaobaiyang 2017-11-27 1 5260