使用sqoop从hdfs将数据导入mySQL卡在100%不执行

查看数: 39650 | 评论数: 6 | 收藏 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2015-7-21 15:13

正文摘要:

本帖最后由 smartleon 于 2015-7-21 15:24 编辑 使用sqoop向mySQL数据库中导入数据测试         场景:数据库已经存在的数据为1,zhangsan@163.com,6000,0,2014-02-202,lisi@163.co ...

回复

smartleon 发表于 2016-8-19 21:46:23
feilong 发表于 2016-8-19 10:37
问题解决了吗?怎么解决的,我这边也出现了相同的问题,请指教

你说的是100%阻塞问题? 我的原因是mySQL设置了主键,而导出的数据第一列正好落在mySQL的第一列上,我两次导出的数据是相同的所以在mySQL端插入的时候与“主键唯一”冲突,就阻塞了,但是没有报错,也许是日志设置的问题,最后我把MySQL表的主键给取消了,之前阻塞的任务就顺利执行了。
============================
至于后面的使用sqoop导出HDFS某几列的问题,应该只能先通过Hive把需要导出的那几列数据提取出来,然后再导出,我目前只找到这种方法,没有和hbase结合考虑
feilong 发表于 2016-8-19 10:37:37
问题解决了吗?怎么解决的,我这边也出现了相同的问题,请指教
smartleon 发表于 2015-7-22 09:18:36
Alkaloid0515 发表于 2015-7-21 23:14
sqoop还没有发现。有hdfs导入mysql一般都是小数据量,这个场景不是太多。所以自己写mapreduce应该问题不 ...

我先接着学习视频的内容吧,争取最近把sqoop的官方文档看了,应该会有答案~至于你说的先去掉主键再加上的想法,我觉得不太好,因为如果不能选择某些数据导入到mySQL数据库的话,这样做最后导致还得去手动吧主键改为不冲突才可以。你说用自增,我觉得还是之前的问题,如果不能选择某些列导入数据库,这个应该也是不能做到的。多多交流~谢谢回复
Alkaloid0515 发表于 2015-7-21 23:14:55
smartleon 发表于 2015-7-21 20:38
我自己部署了7个节点的分布式的环境,只是为了学习。正好他讲使用sqoop导入导出数据,我自己想到的,如果 ...

sqoop还没有发现。有hdfs导入mysql一般都是小数据量,这个场景不是太多。所以自己写mapreduce应该问题不大。
也没有发现sqoop有这样的功能,当然也可能是才疏学浅。

至于主键问题,楼主可以尝试在导入数据完毕,在加上。
或则自己自增为主键,其它非主键
smartleon 发表于 2015-7-21 20:38:01
leo_1989 发表于 2015-7-21 17:13
还真没发现这种,楼主是什么应用场景

我自己部署了7个节点的分布式的环境,只是为了学习。正好他讲使用sqoop导入导出数据,我自己想到的,如果关系型数据库里的表设置了主键,那肯定很多数据导不进去了。
还有就是怎么能解决这个问题~接触的少,望指教
leo_1989 发表于 2015-7-21 17:13:30
还真没发现这种,楼主是什么应用场景
关闭

推荐上一条 /2 下一条