一、yarn产生背景(yarn设计理念与基本架构)

学习了董西成的Hadoop技术内幕第二章总结回顾

由于MRv1在扩展性、可靠性、资源利用率和多框架等方面存在明显不足，Apache开始尝试对MapReduce进行升级改造，于是诞生了更加先进的下一代MapReduce计算框架MRv2。由于MRv2将资源管理模块构建成了一个独立的通用系统YARN，这直接使得MRv2的核心从计算框架MapReduce转移为资源管理系统YARN。

MRv1 的局限性

YARN是在MRv1基础上演化而来的，它客服了MRv1中的各种局限性。在正式介绍YARN之前，我们先要了解MRv1的一些局限性。
包括如下几个方面：

1、扩展性差。
2、可靠性查。
3、资源利用率低。
4、无法支持多种计算框架。

扩展性差

在MRv1中，JOBTracker同时兼备了 资源管理 和 作业控制 两个功能，这成为系统的一个最大瓶颈，严重制约了Hadoop集群的扩展性。

可靠性差

MRv1采用了master/slave结构，其中，master存在单点故障问题，一旦它出现故障将导致整个集群不可用。

资源利用率低

MRv1采用了基于槽位的资源分配模型，槽位是一种粗粒度的资源划分代为，通常一个任务不会用完槽位对应的资源，
且其他任务也无法使用这些空闲资源。
此外，Hadoop将槽位分为MapSlot和ReduceSlot两种，且不允许它们之间共享，常常会导致一种槽位资源紧张
而另外一种闲置(比如一个作业刚刚提交时，只会运行Map Task，此时Reduce Slot闲置)。

无法支持多种计算框架

MapReduce这种基于磁盘的离线计算框架已经不能满足应用要求，从而出现了一些新的计算框架，包括内存计算框架、
流式计算框架和迭代式计算框架等，而MRv1不能支持多种计算框架并存。

怎么办？

为了克服以上几个缺点，Apache开始尝试对Hadoop进行升级改造，进而诞生了更加先进的下一代
MapReduce计算框架MRv2。正是由于MRv2将资源管理功能抽象成了一个独立的通用系统YARN，直接导致
下一代MapReduce的核心从单一的计算框架MapReduce转移为通用的资源管理系统YARN。