博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Ironfan在大数据集群部署、配置管理中的应用
阅读量:5997 次
发布时间:2019-06-20

本文共 5178 字,大约阅读时间需要 17 分钟。

Ironfan

Serengeti中,有二个最重要最关的功能:一是虚拟机管理,即在vCenter中为一个Hadoop集群创建和管理所需要的虚拟机;另一个是集群软件安装配置管理,即在已安装好操作系统的虚拟机上安装Hadoop相关组件(包括Zookeeper,Hadoop,Hive,Pig等),更新配置文件(例如Namenode/Jobtracker/Zookeeper结点的IP等信息),然后启动Hadoop服务。Ironfan就是在Serengeti中负责集群软件安装配置管理的组件。

Ironfan是基于术开发的集群软件部署配置管理工具Chef是一个类似于Puppet和CFEngine的开源的系统配置管理工具,它定义了一套简单易用的DSL(Domain Specific language)语言用于在一台已安装好基本操作系统的机器上安装配置任意软件和配置系统本身。Ironfan基于Chef的框架和API提供了简单易用的自动化部署和管理集群的命令行工具。Ironfan支持部署Zookeeper,Hadoop和HBase集群,也可以编写新的cookbook以部署任意其他非Hadoop集群。

Ironfan最初由美国一家Big Data初创公司使用Ruby语言开发,并在上以Apache Licensev2开源。最开始Ironfan只支持在Amazon EC2的Ubuntu虚拟机上部署Hadoop集群。VMware团队选择了基于Ironfan来开发Big Data集群工具,并实现了一系列重大改进,让Ironfan可以在VMware vCenter中的CentOS 5.x虚拟机上创建部署Hadoop集群。改进后的同样以Apache License v2在上开源,供用户免费和修改。

Ironfan架构

Ironfan的架构。Ironfan主要包括Cluster OrchestrationEngine,VM Provision Engine,SoftwareProvision Engine和用于存数据的Chef Server 和Package Server。

·ClusterOrchestration Engine:Ironfan的总控制器,负责加载解析集群定义文件,创建虚拟机,在ChefServer中保存集群的配置信息,并调用Chef REST API为各个虚拟机创建对应的ChefNode和Chef Client, 并设定各个虚拟机的ChefRole。

·VMProvision Engine:cluster中的所有虚机,并等待虚机得到IP。VM Provision Engine提供了接口以支持在各种虚机云境中建虚机,目前实现Amazon EC2和VMware vCenter的支持。在Serengeti中,所有虚机由Ironfan的用者在VMware vCenter中建,并将IP保存在cluster spec文件中,传递给Ironfan的VM Provision Engine。

·SoftwareProvision Engine: 使用虚拟机中预先创建好的缺省用户名和密码,SSH远程登到所有虚机中同时启动chef-client来安装件。chef-client是Chef框架中的代理程序,负责在其运行的结点上执行预先由Chef Role指定的安装配置脚本。chef-client也会将执行进度数据保存在Chef Server中。

·ChefServer:用于存Chef  Nodes,Chef Clients, Chef Roles, Chef Cookbooks, 提供Chef RESTAPI, 是Chef框架的重要成部件。

·PackageServer:用于存储所需的Hadoop和其他Hadoop所依赖的安装包。

Ironfan外提供了Knife CLI命令行接口,其用者(即SerengetiWeb Service 件)建单独进程调用Knife CLI,通过进程退出状态值判断成功或者失败。具体的集群结点数据和执行进度信息由调用者随时从ChefServer获取。

IronfanKnife CLI

每一个SerengetiCLI cluster命令都一个IronfanKnife CLI命令,包括create (创建集群)、list(查看集群)、config(配置集群)、stop(停止集群)、start(启动集群)、delete(删除集群)。

clustercreate => knife cluster create <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json--yes --bootstrap

clusterlist => knife cluster show <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json--yes

clusterconfig => knife cluster bootstrap <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json--yes

clusterstop => knife cluster stop <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json--yes

clusterstart => knife cluster start <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json–yes --bootstrap

clusterdelete => knife cluster kill <cluster_name> -f/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json--yes

其中参数
/opt/serengeti/logs/task/<task_id>/<step_id>/<cluster_name>.json是Serengeti Web Service
传递给
Ironfan的cluster spec文件,
是一个
JSON格式的文件,包含了集群的
点分
点个数、
件定
描述、集群的配置、
PackageServer和所有虚
机的名称和
IP等信息。Ironfan会分析cluster spec文件,生成Ironfan所需要的cluster定
文件并保存在
/opt/serengeti/tmp/.ironfan-clusters/<cluster_name>.rb。

Ironfancluster文件 (DSL, roles)

接下来,我看看Ironfan是如何定集群的。下是一个名demo的cluster的定文件demo.rb,它是一个Ruby文件,用Ironfan所定DSL言描述集群的组成结构,定义了3个虚拟机组。其中每一个facet定义了一个虚拟机组,包含若干个安装同样软件的虚拟机。每个分组中结点个数由instance指定,虚拟机上要安装的软件由role指定。这个role就是Chef中所定义的role。

Chef Roles Cookbooks

Serengeti中所有Chef Role文件存放于/opt/serengeti/cookbooks/roles/*.rb所有

Chef Cookbook 文件存放于/opt/serengeti/cookbooks/cookbooks/

hadoop_namenode role例,/opt/serengeti/cookbooks/roles/hadoop_namenode.rb 内容如下:

name 'hadoop_namenode'

description 'runs a namenode infully-distributed mode. There should be exactly one of these per cluster.'

run_list %w[

  role[hadoop]   # 一个role可以包含引用另一个role

  hadoop_cluster::namenode   # hadoop_cluster 是一个cookbook, namenodecookbook中的一个recipe

]

如果者需要修改调试 role和cookbook,可在修改role和cookbook 文件后,运行以下命令上传role和cookbook:

knife role from file/opt/serengeti/cookbooks/roles/<role_name>.rb –V

knifecookbook upload <cookbook_name> -V

Cluster Service Discovery

在集群部署过程之中,有些组件的安装和服务的启动顺序是有先后依赖的,比如Datanode服务需要在Namenode服务启动之后再启动,Tasktracker服务需要在Jobtracker服务启动之后再启动,并且这些服务通常不在同一个虚拟机上。因此Ironfan在部署过程中需要控制不同结点上服务的安装和启动顺序,让有依赖关系的结点同步。Ironfan是使用一个名为cluster_service_discovery的cookbook实现相关结点之间同步。

cluster_service_discoverycookbook定义了provide_service,provider_fqdn,provider_fqdn_for_role,all_providers_for_service等等方法,用于实现结点同步。我们以datanode服务需要等待namenode服务启动为例讲解如何实现同步:

·namenoderecipe中,启动namenode服务之后,调用provide_service(node[:hadoop][:namenode_service_name]),向Chef Server把此结点注册为namenode 服务的提供者;

·datanoderecipe中,启动datanode服务之前,调用provider_fqdn(node[:hadoop][:namenode_service_name])向Chef Server查询namenode服务提供者的FQDN(或IP); provider_fqdn方法会每隔5秒种向Chef Server查询一次,直到查询到结果,或者30分钟后超时报错。

其他相关点的同步也与此机制相似,例如Zookeeper结点之间的相互等待,HBase结点等待Zookeeper结点,具体方法调用可查看,, 和 cookbook的源代码。

关于vSphere Big Data Extensions:

VMware vSphere Big Data Extensions(简称BDE)基于vSphere平台支持大数据和Apache Hadoop作业。BDE以开源Serengeti项目为基础,为企业级用户提供一系列整合的管理工具,通过在vSphere上虚拟化Apache Hadoop,帮助用户在基础设施上实现灵活、弹性、安全和快捷的大数据部署、运行和管理工作。了解更多关于VMware vSphere Big Data Extensions的信息,请参见

作者介绍

胡辉 (Jesse Hu)

VMware高级开发工程师

担任VMware大数据产品vSphere BDE和Serengeti开源项目的技术带头人之一,是Serengeti开源项目最早期的开发者,并实现了第一个原型系统,是Serengeti集群软件安装配置管理模块Ironfan的设计者。在加入VMware之前,曾就职于Yahoo,IBM,Oracle等多家IT企业,对开源社区,云计算, Mobile, SNS, Web 2.0, Ruby都有了解和研究。

转载地址:http://wpwmx.baihongyu.com/

你可能感兴趣的文章
KVM虚拟机简介  (ZZ)
查看>>
Silverlight 5 beta新特性探索系列:8.Silverlight 5中自定义扩展标记
查看>>
没有全面屏和人工智能的手机公司终究是不完整的,所以一加5T来了
查看>>
关于PostgreSQL中的多字段索引之三(gin篇)
查看>>
Linux基础系列(四)系统用户和组管理
查看>>
ISA server 的备份与还原
查看>>
【一天一个shell命令】文本内容操作系列-awk
查看>>
linux常用命令之history
查看>>
文本生成哪家强?上交大提出基准测试新平台 Texygen
查看>>
【REACT NATIVE 系列教程之五】NAVIGATOR(页面导航)的基本使用与传参
查看>>
第四章 查询语句:MongoDb VS MySql 4.3
查看>>
Android反编译(未混淆的apk)
查看>>
centos安装qt开发环境
查看>>
java异常的分类
查看>>
NavigationView使用过程的问题解决
查看>>
利用rebase来压缩多次提交
查看>>
MySQL hash index VS Btree index
查看>>
aliyun 镜像
查看>>
算术-几何平均不等式的证明
查看>>
openstack配置增加
查看>>