我使用TRANSFORM USING与蜂巢0.8.1,并注意到这是无效的语法:如何选择列并在Hive中执行TRANSFORM? SELECT a, TRANSFORM(b, c) USING 'fake.py' AS d, FROM test_table; 删除“一”,使得此语句的工作。什么是使用这个的正确方法? ===========解决方案如下: 显然这是不可能的。该fake.py有来处理为好,即一个必须做 SELECT TRANSFORM(a, b, c) USING 'fake.py' AS a, d FR…

2020年11月21日 0条评论 67点热度 阅读全文

我正在尝试使用HiveServer2包通过JDBC通过R驱动程序连接到RJDBC。我已经看到了针对各种dbConnect(What arguments can I pass to dbConnect?)将附加参数传递给drivers包装器的广泛解释,但是看来JDBCDriver的情况比其他驱动程序要复杂得多。我可以使用此特定的URL地址HiveServer2连接到url = paste0("jdbc:hive2://", host = 'tools-1.hadoop.srv', ":", port = 10000,…

2020年11月21日 0条评论 83点热度 阅读全文

我已经在Jdbc解释器下部署了zeppelin 0.6并配置了配置单元。zeppelin配置单元解释器抛出ClassNotFoundException 试图执行 %hive show databases 抛出: org.apache.hive.jdbc.HiveDriver类抛出java.lang.ClassNotFoundException java.net.URLClassLoader.findClass(URLClassLoader.java:381 ) java.lang.ClassLoader.loadC…

2020年11月20日 0条评论 82点热度 阅读全文

我是新手。我有以下员工表。在Hive中检索3rd MAX工资 ID Name Country Salary ManagerID 我使用以下检索第3个最高工资。 select name , salary From ( select name, salary from employee sort by salary desc limit 3) result sort by salary limit 1; 如何做到这一点,以显示每个国家的第三最高工资?我们可以使用OVER(PARTITION BY country)吗?我…

2020年11月20日 0条评论 53点热度 阅读全文

有什么方法可以在使用命令行界面时识别用户正在使用哪个数据库?如何识别用户在hive CLI中使用哪个数据库? ===========解决方案如下: 要知道哪些数据库用户在 组hive.cli.print.current.db =真 则提示将显示配置单元(DB名)

2020年11月20日 0条评论 55点热度 阅读全文

我正在按照此文档进行配置单元挂钩: http://dharmeshkakadia.github.io/hive-hook/ 但是当show tables时出现此错误 2018-08-12 09:57:38,122 ERROR org.apache.hadoop.hive.ql.Driver: [HiveServer2-Background-Pool: Thread-315]: hive.exec.pre.hooks Class not found: HiveExampleHook 2018-08-12 09:57:…

2020年11月20日 0条评论 69点热度 阅读全文

将数据加载到配置单元中时出现以下错误: “java.sql.SQLException:处理语句时出错:FAILED:执行错误,从org.apache.hadoop返回代码1。 hive.ql.exec.MoveTask“问题虽然将数据加载到配置单元中 我在hdfs中有一些数据,我试图在配置单元中加载这些数据。 以下命令我在ambari蜂巢CLI运行: 1-创建表currency_new(CurrencyId INT,ThreeLetterIsoCode字符串,字符串名称,价格BIGINT,LASTUPDATE BI…

2020年11月19日 0条评论 58点热度 阅读全文

我正在与Impala合作,并使用下面的某种模式从数据库中提取表格列表。Impala:显示类似于查询的表格 假设我有一个数据库bank,此数据库下的表如下所示。 cust_profile cust_quarter1_transaction cust_quarter2_transaction product_cust_xyz .... .... etc 现在我像过滤 show tables in bank like '*cust*' 它返回预期的结果一样,这是表的名称中一个字cust。 现在,我的要求是我想这将有在其名…

2020年11月19日 0条评论 55点热度 阅读全文

我已经创建了一个外部表格,该表格使用HDFS中的Parquet存储区中的数据。如何制作自动更新的表格Hive 当删除HDFS中的数据时,表中没有数据。当数据再次插入到HDFS中的相同位置时,表格不会更新以包含新数据。如果我将新记录插入到包含数据的现有表中,则在运行Hive查询时不会显示新数据。 如何创建配置单元表: CREATE EXTERNAL TABLE nodes (id string) STORED AS PARQUET LOCATION "/hdfs/nodes"; 相关的错误: Error: java.…

2020年11月19日 0条评论 71点热度 阅读全文

我正在处理一个有一些表的数据库(2.5 GB)只有40行到一些有900万行的数据。 当我正在做大型表的任何查询时,需要更多时间。 我要上表具有90行不仅导致更少的时间配置单元性能增加 小查询 - > hive> select count(*) from cidade; Time taken: 50.172 seconds HDFS-site.xml中 <configuration> <property> <name>dfs.replication</name&g…

2020年11月19日 0条评论 63点热度 阅读全文
1345672000