一、概念
1.Hadoop1.0的核心组件(仅指MapReduce和HDFS,不包括Hadoop生态系统内的Pig、Hive、HBase等其他组件),主要存在以下不足:
2.优化与发展体现在两个方面:
3.HDFS HA(High Availability,重点)
4.HDFS Federation(联邦机制,重点)
二、资源管理调度框架YARN
1.YARN
2.YARN对待JobTracker的拆分思路(熟记)
3.具体架构(没写文字,但是考试肯定是要文字的):
三、习题
大题
1.HDFS Federation相对于HDFS1.0的优势?
2.YARN相对于MapReduce1.0来说的优势?