Openstack & Hadoop结合项目Sahara


Openstack 项目Sahara,主要是用来搭建Hadoop集群,利用虚拟出来的计算资源,快速搭建Hadoop集群。

Sahara项目与OPenstack其他项目的关系:

图片转自:http://docs.openstack.org/developer/sahara/overview.html


Sahara有两种基本使用流程:

1、快速布署,用户可以增加减少Hadoop节点,,,,

2、分析即服务,根据用户设定的模板创建Hadoop集群,跟计算,然后干掉集群,之后把结果放在(比如Swift容器中)


Sahara 架构包含几个组件:



  • Cluster Configuration Manager - 集群配置管理器,这里所有的业务逻辑驻留
  • Auth component - 身份验证组件,负责客户端身份验证和授权
  • DAL - Data Access Layer, 数据访问层,持续在数据库内部模型
  • VM Provisioning - 负责与Nova、Glance组件沟通
  • Deployment Engine -Hadoop部署引擎,可插入机制,负责部署配置vm,现有管理解决方案
  • REST API - 通过REST提供Sahara功能
  • Python Sahara Client -类似于其他OpenStack组件都有自己的Python Client
  • Sahara pages - Horizon上面的GUI


内容来自:http://docs.openstack.org/developer/sahara/architecture.html

转眼23点,简单介绍,周末继续深入。

Openstack的这个项目,基本能自动化布署Hadoop集群,搞Hadoop的小伙伴再也不用那么麻烦去布多结点了。需要就开个集群,用完就干掉,这种快捷,应该是Openstack的优势,看好这个项目,继续关注。

相关内容