欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

Hadoop五个进程的作用和联系

发布时间:2025/5/22 编程问答 54 豆豆
生活随笔 收集整理的这篇文章主要介绍了 Hadoop五个进程的作用和联系 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1.NameNode:

相当于一个领导者,负责调度 ,比如你需要存一个1280m的文件如果按照128m分块 那么namenode就会把这10个块(这里不考虑副本)分配到集群中的datanode上并记录对于关系 。当你要下载这个文件的时候namenode就知道在那些节点上给你取这些数据了。它主要维护两个map 一个是文件到块的对应关系 一个是块到节点的对应关系。

2. secondarynamenode:

它是namenode的一个快照,会根据configuration中设置的值来决定多少时间周期性的去cp一namenode,记录namenode中的metadata及其它数据 

3. NodeManager(NM):

1、是YARN中每个节点上的代理,它管理Hadoop集群中单个计算节点

2、包括与ResourceManger保持通信,监督Container的生命周期管理,

3、监控每个Container的资源使用(内存、CPU等)情况,追踪节点健

4、康状况,管理日志和不同应用程序用到的附属服务(auxiliary service)

4.DataNode:

a.DataNode的需要完成的首要任务是K-V存储

b.完成和namenode 通信 ,这个通过IPC 心跳连接实现,此外还有和客户端 其它datanode之前的信息交换。

 c.完成和客户端还有其它节点的大规模通信,这个需要直接通过socket 协议实现。  

5.ResourceManager:

 在YARN中,ResourceManager负责集群中所有资源的统一管理和分配,它接收来自各个节点(NodeManager)的资源汇报信息,并把这些信息按照一定的策略分配给各个应用程序(实际上是ApplicationManager)RM与每个节点的NodeManagers (NMs)和每个应用的ApplicationMasters (AMs)一起工作。

    a.NodeManagers 遵循来自ResourceManager的指令来管理单一节点上的可用资源。

    b.ApplicationMasters负责与ResourceManager协商资源与NodeManagers合作启动容器


转载于:https://blog.51cto.com/dbaspace/1874858

总结

以上是生活随笔为你收集整理的Hadoop五个进程的作用和联系的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。