0
点赞
收藏
分享

微信扫一扫

Hadoop-2.7.2伪分布式集群搭建


  • 1.1 修改主机名
      vim /etc/sysconfig/network
      NETWORKING=yes
      HOSTNAME=FTH01
       1.2 修改IP
       两种方式:
      第一种:通过Linux图形界面进行修改(强烈推荐)
       进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加                IP:192.168.8.118 子网掩码:255.255.255.0 网关:192.168.1.1 -> apply
       第二种:修改配置文件方式(屌丝程序猿专用)
      vim /etc/sysconfig/network-scripts/ifcfg-eth0

       DEVICE=”eth0”
       BOOTPROTO=”static”
      HWADDR=”00:0C:29:3C:BF:E7”
      IPV6INIT=”yeED=”yes”
       ONBOOT=”yes”
      TYPE=”Ethernet”
      UUID=”ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c”
       IPADDR=”192.168.8.11”
      NETMASK=”255.255.255.0”
       GATEWAY=”192.168.8.1”

      执行service network restart 命令使设置生效
       1.3 修改主机名和IP的映射关系
      vim /etc/hosts
      192.168.8.11 FTH01
      1.4 关闭防火墙
      #查看防火墙状态
       service iptables status
      #关闭防火墙
      service iptables stop
      #查看防火墙开机启动状态
      chkconfig iptables –list
      #关闭防火墙开机启动
      chkconfig iptables off
      1.5 重启Linux
      reboot
      注意!!!!!!
        CentOS的位数要与Hadoop jdk的位数一致
  1. 安装JDK
       2.1 上传
        通过filezilla软件上传文件,或者通过secureCRT
      2.2 解压jdk
         #创建文件夹
         mkdir /usr/java
         #解压
        tar -zxvf jdk-7u55-linux-i586.tar.gz -C /usr/java/
      2.3 将java添加到环境变量中
        vim /etc/profile
        #在文件最后添加
        ​
         export JAVA_HOME=/usr/java/jdk1.7.0_55
         export PATH=$PATH:$JAVA_HOME/bin
         ​

        
         

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
export JAVA_HOME=/root/Downloads/jdk1.8.0_92
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_HOME=/root/Downloads/hadoop-2.7.2

     
     #刷新配置
     source /etc/profile

  1. 安装hadoop2.7.2
        解压hadoop安装文件到/fth/下
        tar -zxvf hadoop文件 -C /fth/
        注意:hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop
        伪分布式需要修改5个配置文件 /fth/hadoop-2.7.2/conf/
      3.1 配置hadoop
         第一个:hadoop-env.sh
        vim hadoop-env.sh
        #第27行
        ​
         export JAVA_HOME=/usr/java/jdk1.8.0_65

        第二个:core-site.xml
        ​
        <!-- 制定HDFS的老大(NameNode)的地址 -->
        <property>
           <name>fs.defaultFS</name>
          <value>hdfs://FTH01:9000</value>
        </property>
        <!-- 指定hadoop运行时产生文件的存储目录 -->
        <property>
          <name>hadoop.tmp.dir</name>
          <value>/itcast/hadoop-2.7.2/tmp</value>
       </property>

      第三个:hdfs-site.xml
       ​
        <!-- 指定HDFS副本的数量 -->
        <property>
          <name>dfs.replication</name>
          <value>1</value>
       </property>

      第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
      mv mapred-site.xml.template mapred-site.xml
      vim mapred-site.xml
       ​
        <!-- 指定mr运行在yarn上 -->
        <property>
           <name>mapreduce.framework.name</name>
           <value>yarn</value>
       </property>
      

       第五个:yarn-site.xml
      ​
        <!-- 指定YARN的老大(ResourceManager)的地址 -->
         <property>
          <name>yarn.resourcemanager.hostname</name>
          <value>itcast01</value>
       </property>
        <!-- reducer获取数据的方式 -->
       <property>
          <name>yarn.nodemanager.aux-services</name>
          <value>mapreduce_shuffle</value>
       </property>
      
      ​

      3.2 将hadoop添加到环境变量
      vim /etc/proflie
       ​
       export JAVA_HOME=/usr/java/jdk1.8.0_65
      export HADOOP_HOME=/itcast/hadoop-2.7.2
      export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
       source /etc/profile
      

      3.3 格式化namenode(是对namenode进行初始化)
       hdfs namenode -format (hadoop namenode -format)
      3.4 启动hadoop
       先启动HDFS
      sbin/start-dfs.sh
      再启动YARN
      sbin/start-yarn.sh
      3.5 验证是否启动成功
      使用jps命令验证
      27408 NameNode
       28218 Jps
      27643 SecondaryNameNode
       28066 NodeManager
      27803 ResourceManager
      27512 DataNode
      ​​http://192.168.8.118:50070​​ (HDFS管理界面)
       ​​http://192.168.8.118:8088​​ (MR管理界面)
  2. 配置ssh免登陆
      #生成ssh免登陆密钥
      #进入到我的home目录
      cd ~/.ssh
      ssh-keygen -t rsa (四个回车)
      执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
      将公钥拷贝到要免登陆的机器上 cp id_rsa.pub authorized_keys
      ssh-copy-id localhost
      例如 ssh-copy-id 192.168.8.99 将192.168.8.88的公钥拷给192.168.8.99 以后就可以不用输入密码,直接连上192.168.8.99


举报

相关推荐

0 条评论