首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

YARN 简介更新2

YARN 简介更新2

有趣的事实和特性YARN                    提供了多种其他的优秀特性。介绍所有这些特性不属于本文的范畴,我仅列出一些值得注意的特性:
  • 如果作业足够小,Uberization 支持在                    ApplicationMaster 的 JVM 中运行一个 MapReduce                    作业的所有任务。这样,您就可避免从 ResourceManager 请求容器以及要求                    NodeManagers 启动(可能很小的)任务的开销。
  • 与为 MRv1 编写的 MapReduce 作业的二进制或源代码兼容性                    (MAPREDUCE-5108)。
  • 针对 ResourceManager 的高可用性                    (YARN-149)。此工作正在进行中,已由一些供应商完成。
  • 重新启动 ResourceManager 后的应用程序恢复                    (YARN-128)。ResourceManager 将正在运行的应用程序和已完成的任务的信息存储在                    HDFS 中。如果 ResourceManager                    重新启动,它会重新创建应用程序的状态,仅重新运行不完整的任务。此工作已接近完成,社区正在积极测试。它已由一些供应商完成。
  • 简化的用户日志管理和访问。应用程序生成的日志不会留在各个从属节点上(像 MRv1                    一样),而转移到一个中央存储区,比如                    HDFS。在以后,它们可用于调试用途,或者用于历史分析来发现性能问题。
  • Web 界面的新外观。
结束语YARN 是一个完全重写的 Hadoop                    集群架构。它似乎在商用机器集群上实现和执行分布式应用程序的方式上带来了变革。
与第一版 Hadoop 中经典的 MapReduce 引擎相比,YARN                    在可伸缩性、效率和灵活性上提供了明显的优势。小型和大型 Hadoop 集群都从 YARN                    中受益匪浅。对于最终用户(开发人员,而不是管理员),这些更改几乎是不可见的,因为可以使用相同的                    MapReduce API 和 CLI 运行未经修改的 MapReduce 作业。
没有理由不将 MRv1 迁移到 YARN。最大型的 Hadoop 供应商都同意这一点,而且为                    Hadoop YARN 的运行提供了广泛的支持。如今,YARN 已被许多公司成功应用在生产中,比如                    Yahoo!、eBay、Spotify、Xing、Allegro 等。
返回列表