如何编译mapreduce代码

如题所述

举报该问题

其他回答

第1个回答 2016-01-29

Hadoop 2.x 版本中的依赖 jar

Hadoop 2.x 版本中jar不再集中在一个 hadoop-core*.jar 中，而是分成多个 jar，如运行WordCount实例需要如下三个 jar:

$HADOOP_HOME/share/hadoop/common/hadoop-common-2.4.1.jar

$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.4.1.jar

$HADOOP_HOME/share/hadoop/common/lib/commons-cli-1.2.jar

编译、打包 Hadoop MapReduce 程序

将上述 jar 添加至 classpath 路径：

export CLASSPATH="$HADOOP_HOME/share/hadoop/common/hadoop-common-2.4.1.jar:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.4.1.jar:$HADOOP_HOME/share/hadoop/common/lib/commons-cli-1.2.jar:$CLASSPATH"

接着就可以编译 WordCount.java 了（使用的是 2.4.1 源码中的 WordCount.java，源码在文本最后面）：

javac WordCount.java

编译时会有警告，可以忽略。编译后可以看到生成了几个.class文件。

使用Javac编译自己的MapReduce程序

接着把 .class 文件打包成 jar，才能在 Hadoop 中运行：

jar -cvf WordCount.jar ./WordCount*.class

打包完成后，运行试试，创建几个输入文件：

Mkdir input
echo "echo of the rainbow" > ./input/file0
echo "the waiting game" > ./input/file1

创建WordCount的输入

开始运行：

/usr/local/hadoop/bin/hadoop jar WordCount.jar WordCount input output

相似回答

大家正在搜