我有两列看起来像这样在一个蜂巢表:如何总结BIGINT到时间戳蜂巢 Seconds_col Timestamp_col 87 2017-09-25 08:06:00.0 59 2017-09-25 08:10:00.0 我试图创建另一个时间戳列是seconds_col + timestamp_col的总和,但我有问题搞清楚如何将类型为BIGInt的seconds_col加入Timestamp_col(它是一个时间戳列)。有没有人有任何关于我如何在蜂巢中实现这一点的建议?我一直在检查日期和时间函数,但到目前为止,我所…

2020年11月21日 0条评论 20点热度 阅读全文

我使用TRANSFORM USING与蜂巢0.8.1,并注意到这是无效的语法:如何选择列并在Hive中执行TRANSFORM? SELECT a, TRANSFORM(b, c) USING 'fake.py' AS d, FROM test_table; 删除“一”,使得此语句的工作。什么是使用这个的正确方法? ===========解决方案如下: 显然这是不可能的。该fake.py有来处理为好,即一个必须做 SELECT TRANSFORM(a, b, c) USING 'fake.py' AS a, d FR…

2020年11月21日 0条评论 23点热度 阅读全文

我正在尝试使用HiveServer2包通过JDBC通过R驱动程序连接到RJDBC。我已经看到了针对各种dbConnect(What arguments can I pass to dbConnect?)将附加参数传递给drivers包装器的广泛解释,但是看来JDBCDriver的情况比其他驱动程序要复杂得多。我可以使用此特定的URL地址HiveServer2连接到url = paste0("jdbc:hive2://", host = 'tools-1.hadoop.srv', ":", port = 10000,…

2020年11月21日 0条评论 26点热度 阅读全文

我已经在Jdbc解释器下部署了zeppelin 0.6并配置了配置单元。zeppelin配置单元解释器抛出ClassNotFoundException 试图执行 %hive show databases 抛出: org.apache.hive.jdbc.HiveDriver类抛出java.lang.ClassNotFoundException java.net.URLClassLoader.findClass(URLClassLoader.java:381 ) java.lang.ClassLoader.loadC…

2020年11月20日 0条评论 30点热度 阅读全文

我是新手。我有以下员工表。在Hive中检索3rd MAX工资 ID Name Country Salary ManagerID 我使用以下检索第3个最高工资。 select name , salary From ( select name, salary from employee sort by salary desc limit 3) result sort by salary limit 1; 如何做到这一点,以显示每个国家的第三最高工资?我们可以使用OVER(PARTITION BY country)吗?我…

2020年11月20日 0条评论 17点热度 阅读全文

有什么方法可以在使用命令行界面时识别用户正在使用哪个数据库?如何识别用户在hive CLI中使用哪个数据库? ===========解决方案如下: 要知道哪些数据库用户在 组hive.cli.print.current.db =真 则提示将显示配置单元(DB名)

2020年11月20日 0条评论 8点热度 阅读全文

我正在按照此文档进行配置单元挂钩: http://dharmeshkakadia.github.io/hive-hook/ 但是当show tables时出现此错误 2018-08-12 09:57:38,122 ERROR org.apache.hadoop.hive.ql.Driver: [HiveServer2-Background-Pool: Thread-315]: hive.exec.pre.hooks Class not found: HiveExampleHook 2018-08-12 09:57:…

2020年11月20日 0条评论 26点热度 阅读全文

将数据加载到配置单元中时出现以下错误: “java.sql.SQLException:处理语句时出错:FAILED:执行错误,从org.apache.hadoop返回代码1。 hive.ql.exec.MoveTask“问题虽然将数据加载到配置单元中 我在hdfs中有一些数据,我试图在配置单元中加载这些数据。 以下命令我在ambari蜂巢CLI运行: 1-创建表currency_new(CurrencyId INT,ThreeLetterIsoCode字符串,字符串名称,价格BIGINT,LASTUPDATE BI…

2020年11月19日 0条评论 15点热度 阅读全文

我正在与Impala合作,并使用下面的某种模式从数据库中提取表格列表。Impala:显示类似于查询的表格 假设我有一个数据库bank,此数据库下的表如下所示。 cust_profile cust_quarter1_transaction cust_quarter2_transaction product_cust_xyz .... .... etc 现在我像过滤 show tables in bank like '*cust*' 它返回预期的结果一样,这是表的名称中一个字cust。 现在,我的要求是我想这将有在其名…

2020年11月19日 0条评论 19点热度 阅读全文

我已经创建了一个外部表格,该表格使用HDFS中的Parquet存储区中的数据。如何制作自动更新的表格Hive 当删除HDFS中的数据时,表中没有数据。当数据再次插入到HDFS中的相同位置时,表格不会更新以包含新数据。如果我将新记录插入到包含数据的现有表中,则在运行Hive查询时不会显示新数据。 如何创建配置单元表: CREATE EXTERNAL TABLE nodes (id string) STORED AS PARQUET LOCATION "/hdfs/nodes"; 相关的错误: Error: java.…

2020年11月19日 0条评论 25点热度 阅读全文