搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Spark
›
疑问解答
›
spark sql启动的task数量和hbase 设置的numregion数量一 ...
0
3
0
分享
spark sql启动的task数量和hbase 设置的numregion数量一致,如何自定义task数量
tt_tt
2018-8-13 10:29:47
发表于
疑问解答
[显示全部楼层]
阅读模式
关闭右栏
3
8121
About云VIP帮助找工作和提升
我是用hive+hbase+hadoop+spark 在使用spark sql执行语句的时候启动的task的数量与设置的hbase 的numregions是一致,并不是和hadoop上文件对应的块数启动对应的task数量,这样就导致一些文件很大只存在一个task去处理,花费时间很长,有没有办法来设置启动task的数量
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
s060403072
发表于 2018-8-13 12:51:07
--total-executor-cores
--executor-cores
共同决定了当前应用 启动executor的个数
回复
使用道具
举报
显身卡
fly2015
发表于 2018-8-14 10:39:00
repartition
回复
使用道具
举报
显身卡
葬爱ヤ兔爷
发表于 2018-11-8 16:31:05
不知道是否要用到DataFrame呢,如果是的话可以使用option,key "partitionColumn"是分区字段,"numPartitions"是分区数,可以依据条目来分区,不知道对您有没有帮助
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
最佳新人
积极上进,爱好学习
热心会员
经常帮助其他会员答疑
发表新帖
tt_tt
新手上路
关注
主题
帖子
粉丝
TA的主题
spark sql启动的task数量和hbase 设置的numregion数量一致,如何自定义task数量
2018-8-13
24小时热文
数据治理系统实施方案
数据治理解决方案
项目经理应该知道的97件事
大龄失业后,这些副业路子都是被割韭菜
性格决定命运是谎言,这才真正决定命运
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈