分享

使用hive distinct或group by 去重复,遇到奇怪问题

songy 发表于 2015-12-15 12:03:49 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 14 23849
cranberries8 发表于 2015-12-15 13:58:14
songy 发表于 2015-12-15 13:53
非常感谢你帮忙看我的问题。

我检查了机器的时区,都没有问题:

你直接创建一个测试表
添加这几条数据:
14616294        1449772662
14616294        1449772753
14623531        1449772517
25003520        1449807672
用你的命令你看能查的出来不,我 这个环境是没问题的 ,查10号的不会出现11号的数据?
回复

使用道具 举报

songy 发表于 2015-12-15 15:36:56
cranberries8 发表于 2015-12-15 13:58
你直接创建一个测试表
添加这几条数据:
14616294        1449772662

呜。。。
按照你说的,新建了一个测试表,写入一些10号和11号的数据,再查,不会出现11号的数据,回去再查原来的表,还是会有问题。
这能说明环境是没问题的吧?
可是为啥这么奇怪呢?
回复

使用道具 举报

songy 发表于 2015-12-15 16:15:44
cranberries8 发表于 2015-12-15 13:58
你直接创建一个测试表
添加这几条数据:
14616294        1449772662

另一个想不通的地方是 我11好的数据实际上有很多,而我查10号的数据的时候只多3条11号的,其他的又不会出来。。。实在是想不通了

回复

使用道具 举报

cranberries8 发表于 2015-12-15 16:53:53
songy 发表于 2015-12-15 16:15
另一个想不通的地方是 我11好的数据实际上有很多,而我查10号的数据的时候只多3条11号的,其他的又不会出 ...

这样我也想不通了 ,哈哈哈哈
你只有好好找你对应那几条数据所在的文件 ,拷贝出来分析下看
回复

使用道具 举报

12
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条