我是hadoop的新手,正尝试从书中运行一个示例程序。我面临错误错误:java.io.IOException:映射中的键键入不匹配:预期的org.apache.hadoop.io.Text,收到org.apache.hadoop.io.LongWritable下面是我的代码 package com.hadoop.employee.salary; import java.io.IOException; import org.apache.hadoop.io.FloatWritable; import org.apac…

2020年12月2日 0条评论 48点热度 阅读全文

我有一个项目,要求以分布式方式从外部源下载文件。我们已经在Hadoop上进行了巨额投资,并希望利用MapReduce,但更多的是作为分布式任务而不是ETL。 1)有人做过吗? 2)是否应该只有Mapper而没有Reducer? 3)将FTP / HTTP连接的抽象实现传递给Mapper的最佳方法是什么? -明确一点,我的意思是我希望有一个好的方法来进行单元测试而不进行集成测试,因此需要一种模拟FTP / HTTP的方法。 4)MapReduce是此类事情的最佳方法吗? -我们在滥用MapReduce吗? 谢谢。 解…

2020年12月2日 0条评论 58点热度 阅读全文

我正在尝试使用hadoop map reduce,但我不想一次在我的Mapper中映射每一行,而是想一次映射整个文件。 所以我找到了这两个类(https://code.google.com/p/hadoop-course/source/browse/HadoopSamples/src/main/java/mr/wholeFile/?r=3)可以帮助我做到这一点。 而且我收到一个编译错误,内容为: The method setInputFormat(Class) in the type JobConf is not …

2020年12月2日 0条评论 42点热度 阅读全文

我正在尝试使用自定义记录读取器,映射器和reducer设置一个简单的mapReduce应用程序。直到(包括)映射器似乎都可以工作(调用context.write时,我在控制台上写出了键-值对以进行测试)。然后我得到消息 "14/03/04 14:25:43 INFO mapred.JobClient: map 100% reduce 0%". 但是之后,我每3秒进入一个无限循环 "14/03/04 14:25:45 INFO mapred.LocalJobRunner: " 没有详细的消息或其他任何内容。 当在我的…

2020年12月1日 0条评论 39点热度 阅读全文

我正在运行一个hadoop代码,该代码在作业中具有分区程序类。但是,当我运行命令时 hadoop jar Sort.jar SecondarySort inputdir outputdir 我收到一个运行时错误,提示 class KeyPartitioner not org.apache.hadoop.mapred.Partitioner. 我已确保KeyPartitioner类扩展了Partitioner类,但是为什么会出现此错误? 这是驱动程序代码: JobConf conf = new JobConf(get…

2020年12月1日 0条评论 69点热度 阅读全文

我以前的问题发布在这里: Hadoop: java.lang.Exception: java.lang.RuntimeException: Error in configuring object 然后,我按照建议将所有的jar文件打包到一个文件中,第一个问题就解决了。请引用以前的文章以获取源代码。提前致谢。但是新问题来了: 14/04/03 13:47:39 INFO util.NativeCodeLoader: Loaded the native-hadoop library 14/04/03 13:47:40 …

2020年11月30日 0条评论 35点热度 阅读全文

我是Map Reduce程序的初学者,并且在运行该程序时出现此错误: Exception in thread "main" java.lang.VerifyError: (class: com/google/common/collect /Interners, method: newWeakInterner signature: ()Lcom/google/common/collect/Interner;) Incompatible argument to function 错误是什么,要包含哪个jar文件? 解决…

2020年11月30日 0条评论 41点热度 阅读全文

我有以下输出模式public static class RecordMapper extends Mapper<Object, Text, Text, RecordWritable> 输入:文本/文本 输出:文本/枚举(RecordWritable,我自己的类) public static class JoinSumReducer extends Reducer<Text, RecordWritable, Text, DoubleWritable> 输入:文本/枚举(RecordWritab…

2020年11月30日 0条评论 47点热度 阅读全文

我已经在Windows中设置了hadoop单节点。 当我执行命令./bin/hadoop jar Prefix.jar PrefixJob ip op 工作卡住了。没有异常(exception)或任何东西。但它只是卡住了。 如何使其运行? 解决方案如下: 运行WordCount示例的正确命令如下,我刚刚测试了yesterday(在HDInsight上): hadoop.cmd jar jar_file_name.jar class_name iput_file_or_folder_name output_folde…

2020年11月30日 0条评论 36点热度 阅读全文

我正在尝试使用MapReduce查找由标签分隔的制表符分隔输入的总和。数据看起来像这样 1 5.0 4.0 6.0 2 2.0 1.0 3.0 1 3.0 4.0 8.0 第一列是类标签,因此我希望得到按类标签分类的输出。对于这种情况,输出为 label 1: 30.0 label 2: 6.0 这是我尝试过的代码,但是我得到了错误的输出, 显示意外的类标签。 public class Total { public static class Map extends Mapper<LongWritable, T…

2020年11月28日 0条评论 33点热度 阅读全文