Spark-About云-梭伦科技-第4页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

请教dataframe insert into hbase

弱弱请教一下各位大神： dataframe是我从sqlserver里拉出来的，请问 1. dataframe如何保存到hbase，这个datafra ...

remarkzhao 2017-8-23 7 7363
求问：Spark读取Mongodb大文件问题

我通过网上开源的类库来读取mongodb的数据，这样子的话，就会把mongodb中的某个Collection读取成一个RDD，那么问题来了，我的集 ...

青瓜不吃黄瓜 2015-5-14 7 66764
我的DataFrame这样加过滤条件有问题吗？

求解如果不加过滤条件是可以拿到数据的，应该代表取数据这块儿没有问题吧？但是这个where有问题吗？注：数据库里 ...

想ai抽 2015-6-9 7 41099
Spark在yarn-client运行一直accepted

我运行spark的spark.example.SparkPi例子，用yarn-cluster提交是可以运行的，但用yarn-client提交，日志一直打印[mw_shl_code=ja ...

zstu 2017-7-26 7 10957
启动spark-shell 报错。请大神帮忙

chsong@Master:/spark/spark-1.4.0-bin-hadoop2.6/bin$ ./spark-shell --master spark://Master:7077 15/10/03 08:25:24 WARN u ...

chsong888 2015-10-3 7 89332
spark启动问题

sparkStreaming程序使用standalone模式的集群提交模式启动1秒就自动关闭，检查stedrr发现以下信息 17/11/03 14:34:08 INFO ex ...

fengfengda 2017-11-3 7 7112
Spark可以对视频图像数据进行处理吗？

最近要做大数据平台下的视频图像处理，不知道Spark计算框架可以对视频图像数据处理吗？与MapReduce区别大吗？

volcano 2015-3-22 7 39309
spark1.4+hbase0.96+hadoop2.6，spark-submit在standalone模式下报错

集群版本：spark1.4+hbase0.96+hadoop2.6，分为spark集群和hadoop集群，在standalone模式下提交spark-submit报错， ...

轩辕依梦Q 2015-9-21 7 19177
关于 Spark 编译遇到的问题

本人的 spark 版本为1.4.1 ,hadoop 版本为 2.5.0-cdh5.3.2 。现在编译的遇到的错误情况如下：编译语句为：./make-distributi ...

wzf2012 2015-10-23 7 11700
RDD如何修改持久方式？

RDD默认持久方式是MEMORY_ONLY，无法通过persist进行修改持久方式，提示“Cannot change storage level of an RDD after it was ...

evababy 2017-3-22 7 15232
SparkStreaming写入Hbase遇到包问题，跪求各位大神帮忙

在使用SparkStreaming写入Hbase时，出现下面的错误。提交命令： spark-submit\ --master yarn-client \ --driver-m ...

wangweislk 2015-11-18 7 19965
spark 生成HFile bulkload到hbase 延伸三

关于KeyValue的排序以及HFile可否存在重复KeyValue 各位大佬小弟早上又操作了一下。从关系型数据库读取数据集，通 ...

remarkzhao 2018-3-15 7 9649
spark SSH端口问题

spark的master和worker通过SSH进行通讯连接，但是为了保证系统安全性，SSH端口不采用默认端口22，改用其他端口。这个时候spark ...

chyeers 2016-2-18 7 13060
Spark Standalone 读取分机文件失败

集群部署： master: node0 slave: node0, node1, node2 数据存放： node0: /home/uname/data/t_0.txt node1: /home/uname ...

shui0855 2017-2-15 7 6441
sparksql 可以修改map数吗

sparksql 可以修改map数吗

ananan36 2015-12-9 7 21691
sparkstreaming+hdfs 存hdfs文件名问题

使用kafka+sparkstreaming（spark版本1.4.1）,存到hdfs中时，按时间格式存储文件，我想要的结果是每一个批次存成一个文件， ...

轩辕依梦Q 2015-9-8 7 18236
sparkStreaming读取sqlserver，然后把读出来的数据插入到hbase

弱弱请教以下各位大神：我现在有个场景，sqlserver里的数据每时每刻都在增加，现在想用sparkstreaming把增量的数据读 ...

remarkzhao 2017-10-31 7 15949
关于take（num）的一些疑问

take（num）会取出n条元素。因为take是action所以会驱动前边依赖的stage和transfrom运行，我的疑问是他会驱动前边的rdd里所有 ...

邓立辉 2015-12-26 7 11460
RDD迭代元算问题，求助大家

问题：比如我有八个数据0 1 2 3 4 5 6 7迭代多次，比如：第一次： 0和4：位置的两个元素运算生成两个新的元素放到0和4位置上 ...

ltne 2017-3-4 7 8263
想问下关于task的执行问题

想请教下textfile这个函数是在driver上执行还是会被分配到task中执行？如果在wordcount.scala中加入这一段 val startti ...

lsy1996 2017-4-10 7 4577
Spark DataFrame show

val rdd = sc.textFile("..").map(x => x.split(",")).map(x => (x(0), x(1).toLong)) val df = rdd.toDF df.show df.cache ...

zstu 2018-1-16 7 6212
spark history server页面显示时间错误请教

如上题，我晚上有四个计划任务，分别是凌晨一点与凌晨两点执行，但是在spark-histroy-server的监控上的时间是错的，怎么调 ...

lanyangkj 2017-3-17 7 13442
Spark的Partition是如何形成的？

如题，单个Partition里的数据是不是直接从原文件里面范围顺序抽取的（比如原文件里是（1，2，3，4），形成的Partition是（1，2） ...

seraph50 2016-1-17 7 29289
spark on yarn 客户端WEB UI界面打不开

启动：bin/spark-shell --master yarn-client --executor-memory 1g --num-executors 3 部分日志：日志上已经有提示U ...

xw2016 2016-6-10 6 63830
spark streaming 是否可以按照不是时间片而是数据量处理

现在有个项目要求：需要每隔五秒提交一个作业，处理传入spark集群最近的1000条数据，所以这里经过streaming传入的数据必须要先 ...

ltne 2016-11-22 6 11285
idea调试Spark--sparksql

我本地调试想直接从服务器把表的数据查出来，hive是可以的。setMaster我指向了服务器打印日志提示没有表 val sc = new SparkCo ...

玉溪 2016-11-12 6 9545
spark的SPARK_CLASSPATH问题

在spark-submit提交job的时候，会有一些依赖包，通过 SPARK_CLASSPATH配置指明依赖包位置可以方便很多，但是在 standalone clust ...

chyeers 2015-9-14 6 75990
关于spark dag

关于dag 有一点一致不理解，如下：针对环形图，那当我们的需要执行 D.collect 操作的时候，就会引发一个死循环了。请问 ...

Wyy_Ck 2017-3-19 6 7196
SparkSql会生成很多的小文件，怎么解决哦？

SparkSql运行后，会生成很多小文件200个task就生成200个文件，有什么好办法解决？补充内容 (2016-11-14 03:55): package mai ...

玉溪 2016-11-13 6 29315
sparkSQL问题

在spark-shell中，执行如下代码： val sqlContext=new org.apache.spark.sql.SQLContext(sc) import sqlContext._ case c ...

xw2016 2016-6-12 6 6965