分析100G网络对于云计算网络的重要性(1)


1 重新认识100G对于云计算网络的重要性

1.1 大规模运营的云计算需要100G网络

云计算的服务供应从技术和运营的角度看拥有近乎无限的计算、存储、数据通信能力,那么提供云计算服务的IT架构必然是集结了大规模基础资源的数据中心"超级航母"。

云计算IT资源的大规模集中运营,可极大优化基础资源的分布与调度。所以,理想的业务模型是,对于使用云计算服务的企业或个人,能够满足IT业务的最佳方式为计算能力按需增长、应用部署快速实现、工作负载可动态调整、投入成本规划可控。对于云计算服务供应商而言,为满足大量客户(个人或企业)的IT资源需求,其运营的IT基础架构需要有一个大规模的资源池,可基于服务客户数量的增长、客户业务负载增长的需求变化情况提供匹配的IT资源支持能力。

大规模的IT集中建设与运营还带来了大幅度的成本节约效应,来自国外的一份数据展示如图1所示),在大规模IT服务环境下,网络、存储、服务器/管理等各方面的投入都会在单位资源尺度内极大降低,从而在大规模经营条件下可以使得单位资源带来更大的产出。

图1 大规模运营云计算的成本效益

在大规模云计算环境下,性能无疑成为最为关注的核心要素。当前以千兆/万兆为主流广域网很多企业还处在155/622M)的常规基础网络或许能够满足云计算服务初期或者小规模云服务的要求,但随着云计算资源和规模的不断扩大,量变必然导致质变,云计算数据中心成为信息计算服务的核反应中枢,以100G为基础接口的网络分发将很快成为大规模云计算的必然选择。

以国内某互联网公司为例,单个数据中心规模超过万台服务器,在实现多个数据中心的后端网络连接后,发现内部业务量随着整体规模的扩大(数据中心规模扩大、数据中心数量增加)上升很快,单个数据中心到内部业务网络的链路已经扩至16根10G,因此,寻求N*400G/1000G超高速互联的是高性价比的方案选择。

1.2 流量激增的云计算内部

云计算的服务模式,架构上从低至高一般分为IaaS/PaaS/SaaS三种(通称I-P-S模式),如图2所示。云计算的着眼点在于"计算",以不同的计算形式来支撑云的服务,通常情况下,我们将云计算的计算技术分成两种:虚拟化技术和集群技术。

图2 I-P-S模式云计算

虚拟化技术

虚拟化本质在于对物理服务器的计算能力(当然还包括IO、内存、存储空间等)进行逻辑的颗粒化分割,每个分割单元都可以作为独立的计算单元运行,这样使得一台物理服务器上虚拟出多个逻辑服务器,也就是虚拟机,这种方式也称为1:N的虚拟化如图3所示)。

由于大多数物理服务器CPU利用率低下,大量可用计算资源处于闲置,为了提高服务器的利用率,采用虚拟化技术将多个应用集中到单台服务器上(当前的集中比例可达到15:1,将来的集中比可达到40:1~60:1),大幅有效提升计算资源利用率。但这样带来的另一个效果是,多个应用的IO叠加使得服务器的吞吐量密集提升如图3所示),单位网络内数据流量十几甚至数十倍的增长,开始挑战网络转发、传送性能上限,密集计算的吞吐导致现有的千兆网络接入开始形成瓶颈。

图3 虚拟化的密集流量

在云计算特别是IaaS的服务模式下,广泛采用虚拟化技术来进行计算资源的调度服务,同时服务器多核技术迅速发展,而且服务器的网卡进一步向高速万兆接口演进,这使得云计算在服务器接入的IO处理层面不仅带宽扩大,而且流量激增,这直接对骨干网络层面提出了超万兆或面向40G/100G的基本要求。

大规模集群技术

集群技术的目的,是将大量的服务器通过集群方式整合起来,形成一个具有大规模计算处理能力的"巨型计算机",从而完成巨大的计算处理任务,这也是一种N:1的虚拟化技术如图4所示)。在这样的计算应用中,几乎每一台服务器都处在重负荷的计算与吞吐环境,并且由于大型集群内子群之间的密集数据交换,导致了网络上各个方向大规模的数据传输,性能要求已经超越100G规模。

图4 大规模集群的密集流量

万台级服务器无阻塞交换(10000GE=100*100G)已经成为互联网行业云计算业务的基本要求。当前对高密、超高密万兆端口的需求已经达到了目前技术的门限,向100G带宽过渡、并继续提出高密40G/100G端口的挑战需求是大势所趋。


相关内容