立即注册 登录
About云-梭伦科技 返回首页

admin的个人空间 https://www.aboutyun.com/?1 [收藏] [复制] [分享] [RSS]

日志

并行编程

已有 486 次阅读2014-6-8 01:49

下面我从并行编程、资源管理、云计算等三个角度帮助读者理解YARN。

并行编程

在单机程序设计中,为了快速处理一个大的数据集,通常采用多线程并行编程,如图2-12所示,大体流程如下:先由操作系统启动一个主线程,由它负责数据切分、任务分配、子线程启动和销毁等工作,而各个子线程只负责计算自己的数据,当所有子线程处理完数据后,主线程再退出。类比理解,YARN上的应用程序运行过程与之非常相近,只不过它是集群上的分布式并行编程。可将YARN看做一个云操作系统,它负责为应用程序启动ApplicationMaster(相当于主线程),然后再由ApplicationMaster负责数据切分、任务分配、启动和监控等工作,而由ApplicationMaster启动的各个Task(相当于子线程)仅负责自己的计算任务。当所有任务计算完成后,ApplicationMaster认为应用程序运行完成,然后退出。
 

路过

雷人

握手

鲜花

鸡蛋

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 立即注册

关闭

推荐上一条 /2 下一条