通信世界网消息(CWW)5G引入新的网络架构来全面支撑运营商与垂直行业合作的新型商业模式,为通信产业链向各行业领域延伸和创造新的盈利模式提供广阔的发展空间。但部分垂直行业应用带来的极致可靠性需求是5G网络技术面临的极大挑战。
看新闻、看抖音刷不出来……用户在抱怨的同时,可以等一等,回头再看;即使是打电话视频聊天,也可以在断网恢复后重拨。但在一些关键应用领域则完全不能出现断网的情况,5G切片目前已经准备在医疗健康、自动驾驶、机器人等领域大展身手,很多场景需要5G网络保证可靠性,极致的业务体验需要极致的可靠性保障。
构建强健的5G“心”十分关键
在无线侧,5G时代,4G、5G网络通常是实时双连接的,也就是说,保持多路同时连接,从而保证连接的可靠性。甚至可以通过智能网络连接方式来优选接入,比如移动终端可以智能分辨出目前能够接入的5G、4G或者Wi-Fi网络,择优连接,为无线网络上“双保险”,甚至“三保险”,不允许有“宕机”的情况出现。当然,无线可靠性涉及的内容也非常广泛,这是一个精益求精的过程。
在核心侧,承担了通信控制、用户管理、切片编排、媒体转发功能的核心网在5G通信网络中的作用越来越重要,如何提供一张可控、可管、可信的可靠核心网,构建一颗5G强健的“心”,是5G核心网商用必须要考虑的关键。
ZTE Common Core四大维度增强核心网可靠性
中兴通讯自主研发的5G核心网ZTE Common Core,秉承“网络可靠性是设计出来的”理念,基于3GPP 5G SBA(Service-based Architecture)标准框架面向3GPP R16,针对5G核心网可靠性进行了增强设计,为国内外运营商提供一张可信可靠的核心网,配上一颗强健的5G“心”,满足运营商对行业用户(B2B)、最终消费者(B2B2C、B2C)的永远在线的要求,兑现永不断网、服务永远的承诺。
ZTE Common Core从4个方面对5G核心网可靠性进行了增强。
基于SBA架构,通过订阅增强控制面可靠性
所有基于SBA架构的NF(Network Function)通过NRF(Network Repository Function)进行故障检测与状态通知,如图1所示。

图1 NRF故障检测和状态通知
• 注册:NF进入工作态后,向NRF进行注册。
• 状态检测:注册后,NF与NRF周期性发送Heartbeat进行保活;NRF根据Heartbeat是否正常,设置NF的可用状态。
• 状态订阅:NF向NRF订阅其他NF的状态通知。
• 状态通知:在NF状态变更后,根据订阅数据向订阅者发送状态通知;订阅者接收状态通知后,记录NF状态,后续业务处理根据被订阅NF状态记录进行处理,确保业务流程可靠处理。
此方式基于统一的SBI(Service-based Interface)接口,通过统一的框架和IT通用的HTTP2协议,提供一种开放式的总线形式的动态注册和发现机制,在此动态注册和发现机制基础上又进一步提供增强的故障检测与状态通知机制,避免了网状订阅,有效地简化了故障检测与状态通知流程,提高了网络效率,更好地实现了服务层面的高可靠性。
控制与存储分离设计,保证业务信息不丢失
控制面网元与业务信息存储分离,比如控制面网元AMF作为分组接入的一级关口,是5G核心网的关键网元,是提供网络服务的前提,其上所记录的业务信息可靠性和可用性至关重要。业务信息和AMF放在一起的情况下,如果该AMF故障,则会影响该AMF上的业务会话持续性。通过控制面网元与业务信息存储分离(如图2所示),对NF进行无状态设计可以保持在AMF故障情况下业务会话持续性。

图2 控制面网元与业务信息存储分离
• NF按无状态设计,当前处理流程完成后,将用户及会话上下文状态数据实时保存在UDSF(Unstructured Data Storage Function)中。
• UDSF对数据进行多副本保存,包括UDSF内以及UDSF之间。
• NF故障后,NF Set内的其他NF可以从UDSF读取上下文状态数据并继续话务处理。
ZTE Common Core提供的数据共享式无状态设计方案,通过分离存储节点和计算节点,在逻辑上把非结构化数据服务功能(UDSF)和结构化数据服务功能(UDR)进行分离,实现了无状态NF;此方案UDSF存储节点少,便于独立部署和管理;数据源统一,入口少,易于实现对外开放和数据增值;数据层提供统一的FCAPS/仪表盘/升级/扩容等。
控制面与媒体面分离,分层管理,故障隔离
ZTE Common Core在CUPS(Control and User Plane Separation)实现控制面和媒体转发面分离的基础上,面向3GPP R16推出CUPS+解决方案,增强对控制面和媒体面分层管理,隔离单体故障能力,从而实现灵活、高效低成本分布式部署,满足多种应用场景需求。
通过ZTE Common Core CUPS+解决方案(如图3所示),通过全网状部署的方式可实现一个UPF/GW-U对接多个SMF/GW-C即“多U对多C”:支持UPF/GW-U对接多个SMF/GW-C;1个C-Pool可以管理多个U-Pool。

图3 ZTE Common Core CUPS+解决方案
此方案可以带来如下优点:C-Pool可以减少C面冗余,相对于传统的1+1备份方式,C-Pool采用全负荷分担方式,在提供电信级高可靠性的同时,提高资源利用率;1个U对应多个C,某个U或C故障时,只影响本身在线的用户。
变被动为主动,智能化过负荷整网协调控制
对于过负荷场景,ZTE Common Core化被动为主动,通过3级防护对整网进行智能化过负荷协调控制,如图4所示。通常系统过负荷,单网元被动丢包以降低本网元载荷,ZTE Common Core提供三重过载防护,保障整网稳定运行。

图4 ZTE Common Core智能化过负荷3级防护
第一级防护:负载均衡LB(Load Balance)。主动调节NF内和NF间的负载,通过双重LB机制,避免单实例过载。NF内采用基于闭环的re-LB机制:内置LB服务,实现自动的业务负载均衡;预定义+闭环监控,实现精细的负载均衡。NF间则采用基于Load Report的LB机制:基于NF Pool机制,实现池内业务均衡;NF上报负载状态,预防过载现象。
第二级防护:自动弹缩。通过定制个性化KPI结合业务KPI设置智能弹性策略,及时预防过载,实现精准的负荷管理。每种NF内的SC(Service Component)设置各自的KPI弹缩指标和阈值;KPI指标包括CPU、在线用户数、吞吐量等。设置多级弹性策略:依据负荷程度选择批量弹缩数量;区分节假日等策略。
第三级防护:过载控制。以往过载控制(过负荷控制),主要是入向业务负荷过载,网元策略拒绝和丢弃业务,ZTE Common Core从整网考虑设计了入向和出向多重过载控制机制,以提升整网对抗忙时大话务冲击的健壮性。
入向过载控制:基于TPS、CPU负荷、吞吐量、链路状态等设置策略,以通过、拒绝、丢弃方式保护网元本身。出向过载控制:基于CPU负荷、静态要求等设置策略,以通过、缓存、丢弃方式保护周边网元。
ZTE Common Core过负荷解决方案化被动为主动,从NF内到NF外,从片面到全面,全程自动化运维,无需人为干涉(以前为防止乒乓切换,需要手动操作从备到主的系统状态恢复,现在则由系统智能化判断并执行),实现对整网进行智能化过负荷协调控制。
本文秉承“网络可靠性是设计出来的”理念,从网络设计方面介绍中兴通讯5G核心网ZTE Common Core解决方案如何满足5G极致可靠性应用场景的需求,给5G网络装上一颗强健的“心”,但网络可靠性还受环境、安全、人为因素等多方面影响,需要统一规划总体环境、管理方式等。提升网络可靠性也是一个持续改进优化的过程,没有最可靠,只有更可靠。



