ICT全面融合 白盒开启运营商网络转型之路

作者:联通研究院 徐雷 侯乐 责任编辑:耿鹏飞 2018.11.09 08:19 来源:通信世界全媒体

通信世界网消息(CWW)当前运营商网络朝着云化、SDN化、NFV化发展,在ICT融合的今天,云数据中心网络面临着越来越多的挑战。

首先,全球数据中心数量减体量增,呈现出大型化、集约化的发展趋势。超大规模的数据中心往往拥有数以百万级别的物理机和虚拟机节点,这些节点会产生海量的网络信息和数据,同时业务的频繁更新也使得网络要不断发生变化。

其次,云数据中心的网络设备存在着诸多差异性,比如不同厂商设备、同一厂商不同型号、同一型号不同系统版本之间的差异等。网络设备的差异性,最直接的体现就是网络设备的配置方式难以统一,设备的运维成本高,网络排障定位时间长,网络难以实现自动化。

最后,承载业务的变化尤其是虚拟化技术的发展对数据中心网络提出了更高的要求。传统数据中心中接入、汇聚、核心划分三层网络架构不再适用于东西向流量大幅增加的场景。同时5G、8K视频等新业务对网络设备的高带宽、低时延、高可用、低成本提出了超高要求。

云数据中心面临挑战,白盒交换机应运而生

面对云数据中心网络的诸多挑战,在探索网络演进的过程中,SDN/ NFV等技术相继出现,白盒交换机(White Box)也进入人们的视线,白盒交换机与传统交换机的不同是白盒交换机采用开放的架构实现了交换机软件与硬件的解耦,提高网络开放性,灵活性以及可编程能力。白盒交换机通常由ODM提供硬件,由用户选择自研或者第三方提供网络操作系统(NOS)。通过白盒交换机可以对网络控制应用快速迭代,使用SDN的方式对网络进行深度优化。

白盒交换机主要可分为支持OpenFlow协议的OpenFlow白盒交换机和裸白盒交换机。其中,OpenFlow白盒交换硬件开放程度并不高,其网络操作系统往往也被厂商绑定,相对比较封闭,该类交换机通过支持主流的OpenFlow协议如OpenFlow1.3版本,连接控制器实现SDN网络的转发与控制分离。OpenFlow交换机只负责根据OpenFlow流表进行匹配转发,本身没有控制功能,所以也可以被称为白盒。

另外一种则是基于开放硬件架构的裸白盒交换机,该类交换机符合OCP技术规范,提供基于ONIE的网络操作系统安装环境,可以部署各类开源或者闭源的NOS。通常情况下该类交换机的硬件由ODM提供,软件则可以根据具体场景需求在自研NOS、商业NOS以及开源NOS中进行灵活选择。

白盒交换机硬件通过符合OCP(Open Computer Project)标准避免被少数厂家所垄断。OCP是Facebook于2011年发起并主导的一个硬件开源组织,致力于数据中心硬件设备的开放标准,目前OCP拥有超过200多家会员单位。OCP定义了交换机的硬件、芯片SAI以及开放网络安装环境(ONIE)标准。ONIE类似于PC中的BIOS在白盒中用来加载NOS,芯片厂商如Barefoot、Broadcom等提供支持SAI接口的芯片,ODM厂商如广达、智邦等通过加工支持ONIE标准的硬件交换机。软件厂商或者交换机厂商开发的交换机系统软件能够适配OCP硬件,就可以通过ONIE启动。

白盒交换机可以打破传统NOS受到设备厂商绑定,比较封闭的局面。ODM厂商遵循了OCP硬件标准,涌现出多种商业NOS和开源NOS。网络管理员通过NOS可以采用类似管理标准服务器一样的方式管理白盒交换机。随着SDN的高速发展,互联网与运营商巨头公司通过自研NOS并将其贡献到开源社区打造白盒生态圈,促进整个产业的发展,比如微软的SONiC、AT&T的DANOS等。

开源与标准协同,自研NOS是关键

AT&T全球IP / MPLS网络具有超过10万台专有交换设备且流量仍然在不断增长,年增长率接近50%,面向5G AT&T计划在宏网络中部署超过6万台白盒交换机。AT&T希望采用白盒交换机提高整个网络的敏捷性,避免厂商锁定并通过集群化部署减少开支节约成本,其开源主要策略体现在前期内部开发,然后主导并加入开源社区,最后通过开展广泛合作促进业界标准形成。

2017年11月AT&T推出分布式网络操作系统dNOS开放架构,并发布了dNOS白皮书。2018年3月AT&T宣布将其dNOS正式托管给Linux基金会,改名为DANOS,从开源社区中吸取养分,获得相关社区的贡献,预计2018年底首次发布代码。目前DANOS得到了各种Linux基金会团体和成员的支持,包括博通、Inocybe、Metaswitch和Silicom等。DANOS主要是面对运营商网络需求的场景,通过部署装有DANOS操作系统的白盒交换机可以满足客户边缘网络(包括uCPE设备和小区站点路由器)、全局路由网络(包括核心路由设备以及运营商边缘PE设备)、本地路由网络(包括spine-leaf网络设备)等多个场景需求。 

微软在2015年发布了自研的白盒交换机网络操作系统Azure Cloud Switch (ACS),并在2016年的OCP大会上将其开源,命名为Software for Open Networking in the Cloud (SONiC)。SONiC基于微软的交换机接口抽象(Switch Abstraction Interface,SAI),被多个芯片厂商的芯片平台支持。SONiC是基于Linux的网络操作系统,并利用了容器化技术,将各个网络功能部署在容器当中,实现网络应用的灵活性。SONiC的开源使云服务运营商可以借鉴微软在云数据中心网络的经验,并利用其开源的特性,开发出针对性的网络应用。

目前SONiC和SAI已经被众多芯片厂商诸如Barefoot Networks、Broadcom Limited、Cavium、Mellanox Technologies等的ASICs芯片所支持。在国内,开放数据中心委员会(ODCC)网络工作组的凤凰项目,也是依托SONiC开源社区,打造“白盒+开源OS”的网络生态。凤凰项目通过选择社区稳定的SONiC版本软件,发布开源网络OS发行版,已于今年9月份发布了V1.0正式版本。 

开源与标准相互协同已经成为ICT产业生态的主流趋势,在白盒交换机领域也不例外,体现在软件网络操作系统开源、硬件设备的标准化。开源开放的理念也在创新企业芯片厂商、ODM厂商、大型互联网公司、运营商中形成了共识。活跃的开源社区有利于技术的成熟与推广,催生网络创新应用,缩短网络开发周期。符合统一标准的硬件设备有利于打破设备垄断,简化管理员的操作,便于统一管理。当前白盒交换机已经在互联网公司以及运营商网络环境中逐步得到应用,比如面向运营商场景的CORD平台中Trellis项目等。

联通积极推进CORD,优化网络架构

CORD(Central Office Re-architected as a Data center)是一个开源平台,目标是实现电信运营商CO传统端局进行类似云的DC化改造。CORD的场景主要分为家庭接入业务(R-CORD)、企业业务(E-CORD)和移动业务(M-CORD)。中国联通是E-CORD的主导运营商,积极推进CORD在多个领域的研究和实践。在CORD平台中,采用Trellis子项目提供网络服务,Trellis项目采用支持OpenFlow协议的白盒交换机搭建spine-leaf的网络模型,为CORD提供满足收敛比的Underlay环境,同时采用了ONOS控制器对整个网络进行统一管理,为实现网络虚拟化提供基于VxLAN的Overlay网络。

1.jpg

图  Trellis中Overlay与Underlay网络概览

使用传统的方式构建spine-leaf网络,其中的Underlay网络需要依赖于在每个交换机上的复杂的控制协议(如BGP),交换机需要更强的CPU计算能力、内存和复杂的软件,这增加了成本并且很容易失败。另外在Overlay网络构造在Underlay网络上提供私有租户能力,Overlay网络完全依赖于Underlay网络。这种架构会在同一VTEP下不同VNI的虚拟机通信过程中产生发卡(hair-pin)流量,由此带来不必要的网络负担。

Trellis项目通过采用SDN的方式可以有效解决使用传统方式构建leaf-spine带来的问题,具有下列特点。

一是简化了交换节点,使得白盒交换机中不再需要复杂的交换机控制和路由协议;

二是简化网络结构,为整个网络创建一个单一的路由实例用于连接到外部网络;

三是Trellis为Overlay网络对所有租户提供分布式虚拟路由,使流量可以直达物理网络,避免虚拟网关的发卡(hair-pin)流量;

四是协调Underlay网络与Overlay网络,优化资源部署与连通性;

五是采用ECMP多路径和SR路由提供细粒度的路径选择;

六是在每个服务器上集成软件交换机,为连接服务器、应用程序、虚拟机、租户动态创建的容器提供完整的连接方案。

机遇与挑战并存

电信运营商传统网络中网元封闭、资源难以共享,网络建设周期长,随着SDN、NFV以及云计算技术的出现和发展,电信运营商开始寻求网络转型甚至重构。白盒设备的出现对电信运营商网络转型至关重要,面对ICT融合的大趋势,电信运营商积极拥抱开源开放的白盒设备以构建灵活、敏捷的基础设施平台,有助于显著降低企业的CAPEX与OPEX。

白盒交换机产业打造出当前围绕开源软件与标准硬件,各个芯片制造商、ODM厂商、软件商以及用户之间互相协同的生态圈。通过通用的硬件设备,消除对特定厂商的依赖,降低成本。通过开放的软件,增强网络的灵活性、敏捷性。然而,白盒交换机仍然面临着诸多挑战,比如网络操作系统的开发与维护需要投入大量的研发成本,目前交换机市场品牌机仍占据领导地位,如何向白盒设备转变需要进一步研究并经过大量测试。

发表评论请先登录
...
CWW视点
暂无内容