《云计算架构技术与实践》连载(14)2.3.1低TCO,云计算


版权所有,未经华为书面许可,请勿转载或转发 

2.3.1 TCO

TCO能力的构建包括降低和优化云计算数据中心的设备投资成本,以及运维成本两个方面。

设备投资成本的优化与节能主要考虑的架构策略涉及如下策略。

计算资源的成本优化与节省

站在整体数据中心资源集群成本的视角,针对由以太交换网连接起来的计算密集型服务器构成的计算集群,云计算资源集群初始调度分配,以及运行态动态算法的优劣,决定了通过资源占用的削峰错谷可以带来的资源利用率提升,以及相应的成本下降比例。

除调度算法之外,支撑更大规模的集群是实现计算资源CAPEX成本最优化的有效手段,云计算的云资源调度软件通过支持大甚至是超大规模的HA集群 (例如:总集群服务器容量达到128服务器/集群),实现对多种大小不同颗粒度的客户服务器集群的容纳,从而降低了资源碎片概率,提升了资源利用率。

考虑将成本颗粒度从服务器集群细化层面向下细化到单服务器层面,虚拟机VMM引擎在一个服务器范围内的CPU及内存资源调度能否实现跨虚拟机的充分动态共享,则决定了服务器颗粒度内的多虚拟机资源利用率的高低,以及对应的成本竞争力。虚拟化引擎通过支持实时应用调度优化、小包数据中断调度优化,以及内存气泡、内存交换与共享等优化措施来提高服务器级资源利用率。

存储资源的成本优化与节省

在普通云计算数据中心环境下,存储容量一般均在几十TB以上,在满足相同容量及IOPS存储吞吐能力需求的基础之上,需从成本角度出发作出权衡抉择是采用基于集中RAID控制器带一系列存储磁盘的垂直扩展(Scale Up)模式,还是基于全分布式及普通服务器附带硬盘存储的水平扩展(Scale Out)模式。而通过引入全分布式存储,则有望通过差异化架构规避RAID双控制机头随存储容量与处理能力上升所带来的成本指数级增长的矛盾,从而实现云存储成本的大幅降低及性价比的提升。

网络资源的成本优化与节省

可能情况下,考虑取消独立硬件形态的汇聚网络交换机及防火墙网关设备,在通用x86平台上支持Load Balancer,防火墙等设备,从而有效降低网络资源的成本占用。由于部分云计算虚拟网络特性(如ACL,安全组等)可能大量消耗CPU资源,需要考虑将相关功能卸载到智能网卡上。

维护成本的优化与节省

为实现数据中心大规模计算、存储集群依据多层网络交换设备的维护成本最优化,要求云管理OSS支持最大限度的智能化管理,实现系统在故障状态下,对DC内部服务器、网络及存储资源垂直整合的融合架构,一站式交付大大降低硬件安装维护复杂度。

节能减排等生命周期维护成本的节省

为达到数据中心整个运行服务周期中节能减排效率的不断提升,包括在完成相同工作负荷的前提下更为有效地降低服务器、存储及交换设备自身的耗电量,主要有以下几项关键措施:

l  在云管理层面引入更为优秀的资源调度算法,通过热迁移机制实现将轻载应用尽量合并到数量更少的服务器上,其他服务器则直接下电,从提升整体资源利用率

l  在服务器颗粒度内,引入多级节能控制机制,在轻工作负载时自动调整CPU工作于节能状态

l  在硬件选型方面尽可能选择低功耗CPU以及器件、组件以构筑低成本优势,不断改善服务器单板散热布局

l  引入分布式电池或者电容,减少由于UPS在空载或轻载情况下的电源效率损失

l  在数据中心基础设施层引入更为智能的热管理软件及监测手段,并实现充分冷热风道隔离,以及热耗散的自动补偿,甚至通过直接拉通实现整体PUE效率最佳。

 

相关内容

    暂无相关文章