hadoop论坛|社区

About云-梭伦科技»专题 › 交流区› 技术交流

技术交流

收录了 1636 篇文章 · 11 人关注

版块操作

关注本版 RSS订阅

发布新帖

技术交流和问答

推荐主题

新窗

求大神们介绍下hadoop和spark的优缺点，菜鸟报道，求赐教。

求大神们给小弟介绍一下。hadoop和spark。。。感激不尽。

叫我胖哥 2016-9-24 2 13209
sparksql 执行报错

spark-env.sh配置 export SPARK_LOCAL_DIRS=/mnt/diske/sparklocal,/mnt/diskb/sparklocal,/mnt/diskc/sparklocal,/mnt/diskd/s ...

sunt99 2016-9-23 1 11815
hive 删除问题

大家好，请问下，我用insert overwrite 删除了hive的表数据，而且select 也为空，但是hdfs 路径下仍然有文件，一般是什么原因啊 ...

sunt99 2016-9-20 1 7531
大数据脚本用什么语言比较多

现在大数据这个行业里，用什么脚本语言比较多？我刚学没多久，只对shell熟悉些，但听别人说现在已经没人用shell写脚本了，是这 ...

师太跟我吧 2016-9-20 3 8662
本人想自学hadoop，不知道应该从哪开始学，一点头绪都没有

希望各位大牛给点意见和建议！！！！

yd812841013 2016-9-19 6 14721
kettle 嵌套java 脚本

kettle 嵌套java 脚本后，可以集成redis 或其他缓存服务吗？

释怀 2016-9-19 3 12405
hive 插入数据错误

执行如下hive语句，map任务没有错误，reduce任务如下错误： Error: java.lang.RuntimeException: org.apache.hadoop.hive.ql.me ...

sunt99 2016-9-13 3 10322
获取Hadoop集群的数目

Class ClusterStatus ==================================================================== ClusterStatus provides cl ...

nextuser 2016-9-13 0 5926
如何获取当前Map对象所在的block id

如题，或者获取split ID in the mapfunction。 ========================================= InputSplit is = context.getInput ...

nextuser 2016-9-13 0 6267
kettle 连接Hbase

kettle 怎么连接Hbase ，并插入数据？

释怀 2016-9-12 1 10049
Hadoop 3.0.0-alpha1发布

Hadoop 3.0.0-alpha1已经发布了 http://hadoop.apache.org/releases.html#03+September%2C+2016%3A+Release+3.0.0-alpha1+ava ...

ggw0122 2016-9-12 2 10155
spark streaming并发低导致数据积压

spark streaming的某个DStream因为与外部交互，所以处理很慢，处理一条大约2s。这就导致整个流程都在等这个RDD处理完成之后才能 ...

ld512870 2016-9-8 2 23306
编译hadoop2.5.2时出错

按照坛子里的教程http://www.aboutyun.com/thread-8130-1-1.html 编译hadoop2.5.2时编译到Apache Hadoop Common失败了环境 ...

tiviest 2016-9-2 1 5919
求思路，写基于Oozie工作流的web应用

其实就是跟hue中oozie的编辑器差不多，但有一些问题，前台拖拽组件形成工作流后怎么传给后台?传的形式是什么，oozie中web api怎 ...

kennys 2016-9-1 1 6364
spark 累加器操作

因为有数据统计的需要，准备使用累加器Accumulator进行统计，totalCount =jssc.sparkContext().accumulator(0, "totalCounter"); ...

ld512870 2016-8-31 3 14772
Spark Streaming从kafka中读取数据导致OOM

我通过Spark Streaming从Kafka中读取数据的时候遇到这么一个问题，如果我总是读取最新的数据，程序能够正常跑，但是如果我的程序 ...

ld512870 2016-8-31 3 9162
Spark Streaming数据错误的问题

各位大神，我的spark streaming程序的DSteam有A->B->C ,A->B->D,A->B->E三个支线。当我运行程序的时候，如果只是单独的一条线， ...

ld512870 2016-8-31 1 5714
kerberos认证问题

在命令行输入kinit认证或使用.keytab认证过后，在命令行可以进行操作，放到脚本中可以执行，但是使用cronta每天定时执行，到第二 ...

find5 2016-8-29 4 9588
spark streaming进行累加的方法有哪些？

最近在测试spark streaming，里面有个业务需要用到对总数据量的统计，这个在sparkstreaming中怎么实现呢？用updatestatebykey吗 ...

ld512870 2016-8-29 3 11878
一张可以当桌面的Git用法图

旁边同事要给实习生讲如何使用Git，画了张图，我感觉很有用，甚至当桌面都可以，大家可以参考参考

hunter33434 2016-8-26 0 11893
spark怎样编译?

因为已经配置好了hadoop的，所以在官网下载了spark-1.6.1-bin-without-hadoop.tgz 但执行spark-sql时提示： Failed to load m ...

cckp 2016-8-24 2 8110
eclipse为何可以直接运行mapreduce程序

1、通过网络上的各种教程，我搭建了一个hadoop的开发环境，3台CentOS6.5的虚拟机，分别安装了hadoop2.5.2的版本，一个namenode和 ...

斯巴达之狐 2016-8-24 9 11855
spark可以直接升级2.0吗

听说最近spark升级到2.0了是不是直接把原来的spark1.6目录替换了就行了？有人试过吗有哪些需要修改的？大概试了下感 ...

cckp 2016-8-23 2 10099
ganglia 监控

大家好，想问一下，使用gangglia监控hadoop集群，但是有些节点变化不大，可能是什么原因啊，

sunt99 2016-8-23 3 7028
spark-submit提交报错

Exception in thread "main" java.lang.NoSuchFieldError: INSTANCE at org.apache.http.conn.ssl.SSLConnectionSocketFact ...

ld512870 2016-8-22 1 6762
hadoop使用PathFilter遇到的一些问题

本帖最后由 S|C 于 2016-8-23 09:33 编辑问题导读： 1.hadoop在分析数据时怎么过滤文件？2.hadoop过滤文件的输入路径配置需 ...

S|C 2016-8-22 2 11650
ganglia 问题

使用ganglia监控集群中的机器，按照Hadoop ,Hbase等进行分组，使用的是单播方式，配置gmetad.conf 是data_source "Hadoop" node1 ...

sunt99 2016-8-19 1 5456
sqoop2一开始job，出现大量连接文件

sqoop2中，一开始job，start job -j X，就会在hadoop用户的家目录下产生大量的链接文件 lrwxrwxrwx 1 hadoop hadoop 7 ...

redliquid 2016-8-19 3 7633
请问hadoop kerberos 认证有效期可以延长吗？

通过kinit 产生的效期只有一分钟，有办法延长吗？如下： $ kinit -kt op.keytab op [op@TEST-BDD-063 ~]$ klist Ticket c ...

boydreaming 2016-8-19 3 24134
请教大神们一个问题，master主机和两个slave机器启动之后，master上通过50070端

请教大神们一个问题，master主机和两个slave机器启动之后，master上通过50070端口为嘛看不见两个slave的信息 (三个机器可以ssh ...

SuperDove 2016-8-18 9 16755