3.2 数据中心的网络浪涌容载能力与业务调度

为解决数据中心高密应用的调度、流量的浪涌式突发缓冲等关键的性能问题,必然在进行交换平台的基础架构设计上进行技术革新。

首先是在交换平台上提供硬件化的流量管理能力,大容量的缓存匹配密集的硬件调度队列,将调度能力扩展到上万个队列,一旦使上层应用数据流进入相应的硬件队列,则可实现大范围(远超过8个队列)的数据中心级业务调度能力,如图4所示。 

 
图4 大缓存与整体业务调度

另一个技术变革是改变传统交换系统的出端口缓存方式,而采用分布式ingress缓存架构。传统出端口缓存方式,整个系统的业务突发容载能力仅由出端口可分配的缓存大小决定,因此容量是固定的,流量达到一定的突发界限,即瞬时突发数据量超过了出端口缓存大小,便导致整个系统开始出现丢包,而且,经测试观测,此种缓存能力的实际表现与根据端口缓存大小的理论计算是符合的。

分布式缓存技术则采用了区别于传统方式的架构,如图5所示,正常转发过程中,出端口是以万兆线速对外转发数据的,当出现多个万兆到一个万兆的突发流量开始超万兆拥塞时,在出端口的报文标记队列计数将快速增长,达到一定阈值(进入准拥塞状态)便产生端到端(E2E)流控信息到各流量来源(ingress)端口,ingress端口缓存即开始将突发流量缓存到本地并停止对出口发送数据,同时出口仍然以万兆线速发送瞬时的超万兆突发流量,当出端口解除准拥塞状态后,E2E流控通知ingress缓存将保留的数据进行正常转发。

整个分布式缓存机制由流量管理器在硬件层面协调,无需软件参与,因而工作在系统时钟级别。而每个ingress缓存大小均要求在万兆全线速条件下达到200毫秒的突发流量缓存能力,因此,在突发引起的瞬时拥塞时,N个端口向一个端口转发的缓存能力是N*200毫秒,与传统出端口缓存固定能力相比有本质的提升。 

 
图5 分布式缓存架构


相关内容