分享

Ubuntu下hadoop2.4搭建集群(单机模式)

本帖最后由 howtodown 于 2014-11-11 12:13 编辑
问题导读
1.hadoop安装需要哪些必须的步骤?
扩展:
2.这些步骤的原因是什么?
3.为什么要新建帐户,是否可以不使用新帐户?
4.为什么要安装ssh,不安装ssh会有什么后果?






一  、新建用户和用户组
              注明:(这个步骤其实可以不用的,不过单独使用一个不同的用户好一些)
            1.新建用户组      
  1. sudo addgroup hadoop
复制代码




           2.新建用户
  1. sudo adduser -ingroup hadoop hadoop
复制代码




           3.添加hadoop用户权限      
  1. sudo gedit  /etc/sudoers
复制代码


          打开sudoer文件后添加hadoop用户


  1. # User privilege specification
  2. root    ALL=(ALL:ALL) ALL
  3. hadoop  ALL=(ALL:ALL) ALL
复制代码


      4.使用hadoop用户登录


二、安装ssh
     
  1. sudo apt-get install openssh-server
复制代码


     


    安装完成后,启动服务
  1. sudo /etc/init.d/ssh start
复制代码


    查看服务是否正确启动:ps -e | grep ssh


     集群、单节点模式都需要用到SSH无密码登陆,首先设置SSH无密码登陆本机。
     输入命令
  1. ssh  localhost
复制代码


首次登录需要输入yes



      设置免密码登录,生成私钥和公钥
  1. ssh-keygen -t rsa -P ""
复制代码



     下面我们将公钥追加到authorized_keys中,它用户保存所有允许以当前用户身份登录到ssh客户端用户的公钥内容。
  1. cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
复制代码



   然后使用ssh localhsot就可以无密码登录了。
   使用exit退出登录



三、安装Java环境
     以前的教程都是建议安装Oracle的JDK,不建议使用OpenJDK,不过按http://wiki.apache.org/hadoop/HadoopJavaVersions中说的,新版本在OpenJDK 1.7下是没问题的。通过命令安装OpenJDK 7。坑
  1. sudo apt-getinstall openjdk-7-jreopenjdk-7-jdk
复制代码


    查看安装结果,输入命令:java -version,结果如下表示安装成功。



  查看安装结果,输入命令:java -version,结果如下表示安装成功。




四、 安装Hadoop 2.4.1
   2.4.1的下载地址为: http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.4.1/hadoop-2.4.1.tar.gz,安装教程主要参考了官方教程http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html
下载后,解压到/usr/local/中。然后修改文件夹名为hadoop


    赋予用户对该文件夹的读写权限(这个问题很是坑,我当时配置的时候被一些方法坑了,不太了解文件权限的东西)
    有的建议是这样:
  1. sudo chmod 774 /usr/local/hadoop
复制代码


    但是我用这个命令之后,文件夹全部被隐藏了,都打不开。最后我是删除了hadoop文件夹,使用下面这个才解决的。
  1. sudo  chown -R hadoop:hadoop   /usr/local/hadoop
复制代码


  
     配置~/.bashrc
     配置该文件前需要知道Java的安装路径,用来设置JAVA_HOME环境变量,可以使用下面命令行查看安装路径
  1. update-alternatives - -config java
复制代码


        执行结果如下:
      

     配置.bashrc文件
  1. sudo gedit ~/.bashrc
复制代码



  1. #HADOOP VARIABLES START
  2. export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386
  3. export HADOOP_INSTALL=/usr/local/hadoop
  4. export PATH=$PATH:$HADOOP_INSTALL/bin
  5. export PATH=$PATH:$HADOOP_INSTALL/sbin
  6. export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
  7. export HADOOP_COMMON_HOME=$HADOOP_INSTALL
  8. export HADOOP_HDFS_HOME=$HADOOP_INSTALL
  9. export YARN_HOME=$HADOOP_INSTALL
  10. export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
  11. export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
  12. #HADOOP VARIABLES END
复制代码


               执行下面命,使添加的环境变量生效:
  1. source ~/.bashrc
复制代码


              编辑/usr/local/hadoop/etc/hadoop/hadoop-env.sh
              执行下面命令,打开该文件的编辑窗口
  1. sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh
复制代码


              找到JAVA_HOME变量,修改此变量如下
  1. export JAVA_HOME==/usr/lib/jvm/java-7-openjdk-i386   
复制代码





五、测试wordcount
     单机模式安装完成,下面通过执行hadoop自带实例WordCount验证是否安装成功
     /usr/local/hadoop路径下创建input文件夹   
  1. sudo mkdir input
复制代码


    拷贝README.txt到input   
  1. cp README.txt input
复制代码




    执行WordCount
  1. bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output
复制代码



运行如下


执行 cat output/*,查看字符统计结果



结果如下



没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条