用户组:游客
使用hive distinct或group by 去重复,遇到奇怪问题: 1:我用hive sql, 使用DISTINCT ,或GROUP BY去重复,得到的查询结果为5 ...
我写了一个UDF函数,用来读取一个配置文件Conf_Term_prds的中的正则表达式,用来匹配hive表中满足记录的数据,不满足的查询结果 ...
大家好,我是刚刚开始学习hadoop,我想使用Hive来存储机器设备的运行记录数据(就是每天会产生一些数据),这种情况下,我应该如 ...
自己写了个hive的UDF来实现Oracle中decode功能。 [mw_shl_code=java,true]package com.danny; import org.apache.hadoop.hiv ...
本帖最后由 helianthus 于 2015-12-6 22:29 编辑 问题导读: 1.tez local模式有什么好处? 2.本地模式和集群模式下,主要组 ...
[hadoop@master bin]$ hive 15/12/04 11:43:18 WARN conf.HiveConf: DEPRECATED: Configuration property hive.metastore.local ...
能不能在hive里面创建一个database,给这个database设置单独的字符集
比如 按天分区 分区字段day 只有当day指明如 day='2015-12-03' 这样时才能起到只扫描分区文件的效果 这样day=from_unixtime( ...
如何查看hive版本? hive没有提供hive --version这种方式查看版本好,所以要找到hive所在目录,然后查看jar包的版本号 [mw_ ...
各位大神好: 各位大神将hive里面的表导出到关系型数据库一般都是怎么做的啊 如果使用sqoop,需要先在关系型数据库新建 ...
采用beeline连接hive server是遭遇到如下错误: 但是这个查询在hive cli里面是OK的,同时观察到因为hive_triples表很 ...
如题。 建表:create table test222 (id int,name string) row format delimited fields terminated by ',' stored as textfile ...
[mw_shl_code=sql,true]select * from tab_name1 where create_date>=(select max(create_date) from tab_name2) and create_dat ...
我在用Eclipse编译Hive0.9.0时,编译通不过,如下所示: Buildfile: /home/cdl/branch-0.9/build.xmlivy-init-dirs: [echo] Pr ...
有个hive任务,执行这个sqlall表的字段很多,大概有100+。而且记录行数大概有15000万条记录,tmp表是大概1000万的记录。 这个sq ...
请问 hadoop 2.4 与 hive0.14兼容吗? 谁知道官网的兼容列表url 目前生产环境 我们使用的hadoop2.4+hive0.13,使用ambari管 ...
启动hive有警告,执行命令,无响应。 Jack@WIN-CH0ELM7ACUD /cygdrive/c/hive-0.10 $ bin/hive Logging initialized using co ...
使用hive时hive> describe database bdw_main; OK bdw_main hdfs://IFPHDFS root USER Time taken: 0.006 ...
1.导入的脚本如下:sqoop import --connect jdbc:mysql://***.***.***.****:3306/test--username root --password **** –table ...
2015-09-21 22:08:46,148 INFO [Thread-7]: hdfs.DFSClient (DFSOutputStream.java:createBlockOutputStream(1378)) - Exce ...
目前有5000个mysql的数据库,每个库中有10个表,每个mysql的10个表的对应的表结构都是一致的。10个表,其中有两个表数据量较大, ...
问题1. 好像一直听说distinct()是一个reduce ,现在突然对这个观点表示质疑,因为distinct完全可以使用多个reduce呀 因为在p ...
com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure The last packet successfully rec ...
使用hive查询出现问题,如下: 库data: 表:ocount 数据量600W左右 表结构 hive> desc ocount; OK count_id ...
一直想问这个问题,hive使用mysql作为metastore,作为一个hive集群,到底需要在几台机器上部署hive?看了好多部署的帖子,发现都 ...
hive元数据中有各种表 (DBS,TBLS,SDS等)但在源码中找了一下 没有关于更新这些表的代码 比如 我新建一张hive表,则元数据TB ...
麻烦各位帮我看看,hiveserver2 中的日志显示一直在运行mapreduce ,但是一直不停。这是什么问题,我该怎么定位?
简单描述下情况: 表: table1 table2 中间表 new_table HQL: insert overwrite table new_table select distinct a. ...
问题描述: hive表中存放了很多数据,其中有两个字段 referrer_url 上一页访问的页面 url 从上一个访问过来的当前页 我 ...
一直好好的,今天再hive中执行一条select语句,感觉速度很慢,于是强行停止了,结果再也进不去hive命令行了,同时发现NameNode也 ...
本版积分规则 发表帖子
查看 »