用户组:游客
有C++和linux开发经验,0基础java经验,想学大数据挖掘和机器学习。需要重点学习java中的哪些知识?java web部分是否必须学习? ...
想从事机器学习和深度学习,学习大数据软件使用,需要学习java web和SSH框架吗? 只看java SE 够吗?
spark thrift server 任务跑几天后,spark会越来越慢,很多任务会挂掉,有人遇到吗?
hive impala hbase 整合成功。在hue的hive视图中,创建一个映射表,在hive中看到的字段顺序和在impala视图看到的顺序不同,导致i ...
大家好,代码写完了。遇到:Caused by: java.io.IOException: Added a key not lexically larger than previous. Current cell = ...
如题
有人编译过apache-hawq-src-2.0.0.0-incubating吗,能提供下编译后的包?我环境一直编译不了.谢谢
各位好,请教一下,现在部署了三节点的hadoop ha集群(hadoop version 2.7.1, OS:Centos 7.3),一切测试正常,然后开始集成ke ...
最近用matplotlib画图,但是遇到了问题,如图,这种应该怎么解决呢?
本人使用的是hbase1.3.1的版本,master默认的端口是16000,目前已经没有了hbase.master这个配置,只有hbase.master.port这个配置 ...
ntp是很多集群必备的软件。但是在设置开机启动却失效。多次尝试仍然失败,原来是因为服务冲突了。 解决办法: [mw_shl_code= ...
spark thrift server 怎么配置每台能分配到资源,提交是yarn
现有环境ZK=3.4.6 由于总是出现未修复的BUG,想升级到3.4.10或者3.4.11 HADOOP=2.6.0 出现的BUG也不少,想升级到2.6.5 HBASE= ...
这是flume配置
请问下Hadoop完全分布式集群搭建好之后 通过浏览器查看集群情况,必须要局域网的电脑登陆这个网站才能查看吗 还是外网也可以。还 ...
spark-sql在使用mysql存储元数据,创建的表都存储在hdfs的情况下,是否可以不安装hive? 我现在hive,spark都装了,每次启动spark ...
场景:任意时刻需要存储大量的高频数据 存储后 key按照时分秒设计 当数据多线程大批量写入后 其它程序读取时无法获取最新的一部 ...
大神帮忙看下,这是啥问题 ? temp.take(2) [(2, [4, 5, 5, 1, 4, 3, 3, 3, 4, 3, 4, 3, 3, 4, 5, 1, 4, 5, 4, 4, 3, 3, 4, ...
spark有没有全局缓存?想缓存一个文件内容供给一个任务使用
网上只找到了一篇相关的资源,但是没有他详细的环境说明。注意啊,是CDH CM管理的平台,不是hadoop。网上很多人都是打着hadoop ...
写了个hdfs管理的图形化工具,遇到了一个比较麻烦的问题。工具在连接不存在的hdfs时,会卡死,日志显示有一个线程每隔一段时间就 ...
如下图: 按理是应该可以选择pgsql oracle这些的呀,但是怎么设置都不行。 麻烦大家指导下,大概是哪些地方出错了。集群搭好以 ...
小白新人,有个问题想请教一下各位老师: 在百度云(或者诸如此类的阿里云、谷歌云之类的云平台上)购买了一台配置不错的云主机 ...
大家好,请问,对于一个大数据团队,你们的项目成员如何配置的
几个节点里面,其它都正常,唯独有一个,一天自动重启无数次,还不定时。/var/log/message里面没有任何报错,目前能找到错误比较 ...
CDH集群中,server正常,另外几个agent也都正常,唯独这个agent节点有问题,总是自动关闭。请问是在哪里看相关日志?或者相关的 ...
hadoopo fs -put file /tmp/上传文件出现某行非常长,后面全部是空白行,为什么呢
现有一堆键值对数据,如何设计一个mapreduce程序来求相邻时间点的差值呢?
第一次用云服务器,一脸懵逼。主要是自己电脑太渣了,学到spark已经运行不动了,想用云主机接着学习下去。 用人用过美团的这个 ...
data=lines.map(lambda line:line.split(",")).map(lambda record: (record[0], record[1]) print data.collect()或者data.save ...
本版积分规则 发表帖子
查看 »