问题:修改后的wordcount程序没有反映出修改效果
描述:第一次搭建hadoop,使用centos7.3,三台slaver,一台master。直接按照http://blog.csdn.net/dream_an/article/details/52946840这个博客的方法搭建,运行自带wordcount,一切正常。 然后我照着hadoop in action里说的修改了源码里hadoop-mapreduce-project\hadoop-mapreduce-examples\src\main\java\org\apache\hadoop\examples路径下的wordcount, 把StringTokenizer的分隔符改成";," 分号和逗号,然后重新编译程序,用 hadoop jar playgound/wordcount.jar WordCount /input /output 运行。 然后输入数据是aaa;bbb,ccc ddd
运行后的结果仍然是以空格来分割:
aaa;bbb,ccc 1
ddd 1
我还尝试更改reduce函数里,控制sum>=4才输出,发现也没有效果,后来我干脆直接在map里直接word.set(value.toString()),跳过分割一行的过程, 结果居然还是给我按照空格分行了。 这就好像我对map 和reduce函数做的修改完全没有起作用,求教这是为什么?
|