0
点赞
收藏
分享

微信扫一扫

大数据笔记--Hadoop(第六篇)

夜空一星 2022-03-14 阅读 66

目录

一、YARN

1、概述

2、YARN的结构

二、YARN的执行流程

三、ResourceScheduler-资源调度器

1、FIFO(先进先出)

2、Capacity(资源容量)

3、Fair(公平资源)

四、完全分布式结构

1、结构

2、常见问题 

3、添加节点

五、Federation HDFS-联邦HDFS

1、当前HDFS架构的弊端

2、联邦HDFS


一、YARN

1、概述

①、YARN(Yet Another Resource Negotiator - 迄今另一个资源调度器) - 负责任务管理和资源调度

②、YARN是Hadoop2.X开始出现的,也是Hadoop2.X中最重要的特性之一。也正是因为YARN的出现,导致Hadoop1.X和Hadoop2.X不兼容

③、产生原因

2、YARN的结构

①、主进程ResourceManager

②、从进程NodeManager

③、辅助进程ApplicationMaster

二、YARN的执行流程

1、当ResourceManager收到客户端提交的任务之后,会先将这个任务临时存储下来,等待NodeManager的心跳

2、当ResourceManager收到NodeManager的心跳之后,会在心跳响应中将Job任务返回给NodeManager

3、NodeManager通过心跳响应之后,收到任务之后,就会在本节点内部开启一个ApplicationMaster进程,然后将Job任务交给这个ApplicationMaster处理

4、ApplicationMaster收到任务之后,会将Job任务来进行拆分,拆分成子任务。例如,如果是一个MapReduce程序,那么拆分成MapTask和ReduceTask

5、拆分完成之后,ApplicationMaster会给ResourceManager发送请求申请资源

6、ResourceManager收到请求之后,将请求交给内部组件ResourceScheduler处理

7、ResourceScheduler收到请求之后,会将资源的描述封装成一个Container对象返回给ApplicationMaster

8、ApplicationMaster收到资源之后,会对资源进行二次拆分,分配给具体的子任务,然后将子任务分配到不同的NodeManager上执行,并且ApplicationMaster还会监控这些子任务的执行

9、如果子任务执行失败,那么ApplicationMaster监控到之后,会自动的重启这个失败的子任务,或者会自动的将失败的子任务分配到其他的节点上重新执行

10、当Job任务结束之后,ApplicationMaster会向ResourceManager发送请求,同时请求注销自己

三、ResourceScheduler-资源调度器

在Hadoop中,目前为止,支持3种资源调度器:  FIFO(先进先出),Capacity(资源容量)以及Fair(公平资源)

1、FIFO(先进先出)

2、Capacity(资源容量)

3、Fair(公平资源)

四、完全分布式结构

1、结构

完整的hadoop至少要13个节点,我们就用三台虚拟机进行模拟搭建。

2、常见问题 

①、在第一次关闭Hadoop之前,先修改stop-dfs.sh和stop-yarn.sh中的内容。将start-dfs.sh中添加的内容放到stop-dfs.sh中,将start-yarn.sh中的内容放到stop-yarn.sh中

②、在Hadoop集群中,一定要先启动Zookeeper再启动Hadoop

③、以后再次启动Hadoop,只需要通过start-all.sh即可启动

④、在执行命令的时候,出现了Name or service not known或者UnknownHost之类的异常,那么先检查主机名是否写对;再检查/etc/hostname或者是/etc/hosts文件是否配置正确

⑤、在进行ssh的时候需要输入密码,需要重新进行免密

⑥、在执行命令的时候,出现了command not found,那么先检查命令是否配置正确;然后再检查/etc/profile中的环境变量是否配置正确;最后确定对/etc/profile文件修改之后是否进行了重新生效source

⑦、在格式化的时候,出现了HA is not enabled/HA is not available之类的异常,那么说明Hadoop和当前系统出现了兼容性问题 - 重装系统

⑧、如果执行命令的时候出现了IllegalArgument之类的异常,那么说明命令或者参数写错了

⑨、如果启动之后,发现缺少了QuorumPeerMain,那么Zookeeper启动失败

⑩、如果启动之后,发现缺少了NameNode/DataNode/JournalNode/ DFSZKFailoverController进程,可以试图通过hdfs --daemon start namenode/datanode/journalnode/zkfc来单独这个进程

⑾、如果启动之后,发现缺少了ResourceManager/NodeManage进程,那么可以试图通过yarn --daemon start resourcemanager/nodemanager来单独启动这个进程,例如yarn --daemon start nodemanager

⑿、如果在启动的时候,出现process already running as xxx,那么先kill -9 xxx,然后再单独重新启动

⒀、在NameNode格式化的时候,如果格式化失败,那么改错之后,先删除掉/home/software/hadoop-3.1.3/tmp/dfs/name目录,再重新格式化

注意:

3、添加节点

①、先修改新节点的主机名

②、进行主机名和IP的映射

③、重启

④、配置免密互通

⑤、所有的主机都需要和新添加的节点进行免密

⑥、从其他节点拷贝一个Hadoop安装目录到第四个节点上

⑦、新添加的节点上,进入Hadoop的安装目录,然后删除对应的目录

⑧、新节点配置环境变量

⑨、启动DataNode与YARN

五、Federation HDFS-联邦HDFS

1、当前HDFS架构的弊端

        NameNode会将元数据维系在内存中。实际开发中,一台服务器大概能腾出50G左右的内存给NameNode来使用,也就意味着一台服务器大概能存储3亿~4亿条元数据,经过计算,意味着NameNode所管理的集群大概能够存储12~15PB的数据。但是在现在的开发中,很多大型企业的数据量已经超过上百PB,原始的NameNode架构就不能满足这个需求。

        NameNode无法做到程序的隔离。所有的元数据都维系在一个NameNode上,意味着如果某一个任务占用的资源比较多,那么就会影响其他在进行的任务。

        所有的请求都只能访问这唯一的一个NameNode,此时NameNode的并发量就成了整个HDFS的并发瓶颈。

2、联邦HDFS

        在联邦HDFS中,可以利用多个节点同时作为NameNode对外接收请求,在请求之前,需要将HDFS中的路径于NameNode之间来进行映射。每一个路径必须对应某一个NameNode。

        在联邦HDFS中,所有的请求不再集中于某一个节点上而是分散到不同的节点上,从而提高了集群的并发量的上限。

        因为不同路径分别对应了不同的节点,此时某一个节点上资源被过多的占用,例如节点的磁盘的IO资源占用比较多,并不会影响其他的节点的读写。

        因为利用多个NameNode来实现功能,此时元数据也不再集中于一个节点上,而是分散到多个节点上,大大的提高了集群的数据量容纳的上限。

        在联邦HDFS中,要求所有的NameNode的BlockPoolID必须一致。

举报

相关推荐

0 条评论