下面以创建项目名为WordCount为例,介绍如何在Eclipse中创建和运行MapReduce项目。
(1)创建Project,点击File菜单,选择New→Project…。如图4-6所示。
图4-6 创建Project
(2)创建MapReduce项目,选择Map/Reduce Project,点击Next。如图4-7所示。
图4-7 选择Map/Reduce Project
(3)填写项目名,填写Project name为WordCount即可,点击Finish就创建好了项目。如图4-8所示。
图4-8 填写Project name
(4)此时在左侧的Project Explorer就能看到刚才建立的项目了。如图4-9所示。(www.xing528.com)
图4-9 Project Explorer视图
(5)新建Class,接着右键点击刚创建的WordCount项目,选择New→Class。如图4-10所示。
图4-10 创建Class
(6)配置Class信息,在Package处填写org.apache.hadoop.examples;在Name处填写WordCount。如图4-11所示。
图4-11 配置Class信息
(7)创建Class完成后,在Project的src中就能看到WordCount.java文件,在该文件中编写实现单词统计的代码。
(8)因为Eclipse运行MapReduce程序默认为Hadoop单机运行,程序运行时默认读取本地目录,通常提示Input路径不存在。所以在运行MapReduce程序前,需要将/usr/local/hadoop/etc/hadoop中修改过的配置文件,例如chadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml以及log4j.properties等,复制到项目下的src文件夹,程序才能正确运行。其中,log4j用于记录程序的输出日记,如果没有复制该文件到项目中,虽然不影响程序的正确运行的,但运行程序后,只能在Console面板看到警告信息,无法看到任何其他提示消息。
(9)点击工具栏中的Run图标,运行MapReduce程序;或者选中Project Explorer中的WordCount.java,右键点击选择Run As→Run on Hadoop,也可运行MapReduce程序。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。