5G核心网NFS运维保障实践

责任编辑:王禹蓉 2021.03.04 14:26 来源:通信世界全媒体

通信世界网消息(CWW)5G核心网(5GC)是5G建设的重要组成部分,采用全新技术,在实现网络部署、网络功能、新业务开展的同时,监控保障也面临全新挑战。在4G核心网(EPC)中,网元由专有设备承载,硬件属性较强。而在5G核心网环境中采用基于服务架构(SBA),融入云原生、微服务等设计思想, 以软件化,模块化、服务化的方式构建核心网。

全新核心网运维面临三大挑战

全新核心网的运维保障面临以下三大挑战。

一是网络功能拆分。依据3GPP定义,5G核心网的各网络功能(NF,Network Function)在功能级别上拆分解耦,拆分出若干个独立解耦的网络功能服务(NFS,Network Function Service),这些网络功能独立运行,提供标准化服务接口,通过相互调用访问实现网络功能。随着虚拟化、云原生技术的融入,在5G核心网方案中不再大量使用专有硬件设备,取而代之的是通用服务器承载的虚拟网元,虚拟机、容器POD数量飞速增长,每个工作负载同时提供多个IPv4、IPv6工作平面。相较4G EPC,由于众多方面演进叠加在一起,在5G核心网SBA架构中虚拟化后的NFS实例数量以2个乃至更多的数量级增长,监控对象数量多是5G核心网保障侧第一个挑战。

二是服务自动化管理。通过网络功能仓储(NRF,NF Repository Function),5G 核心网的各类网络功能服务得以自动化管理,实现服务的自动发现以及注册、更新、状态检测等,避免服务访问中进行大量手动配置工作;集中控制面可以将大量跨区域的信令交互变成数据中心内部流量,优化信令处理时延;根据业务应用的变化,按需快速扩缩网络功能和服务,提高网络的业务响应速度。自动化管理在生产侧提升了管理效率,同时在核心网保障侧增加了动态性强、难以跟踪的新挑战。

三是通信路径优化与交互解耦。4G核心网的网元之间有着固定的通信链路和访问路径。例如,用户的位置信息必须从无线基站上报给移动管理单元(MME),然后通过其发至服务网关(S-GW) 传递给PDN网关(P-GW),最终由策略计费规则功能单元(PCRF) 进行策略更新。网元之间的通信遵循请求者和响应者的点对点模式,是一种相互耦合的传统模式。在 5G 核心网服务化架构下,各网络功能服务之间可以根据需求按需通信。5G 核心网架构下的网络功能服务间通信机制进一步解耦为生产者和消费者模式,具备灵活可编排、解耦、开放等优点,是 5G 时代迅速满足垂直行业需求的一个重要基础能力。各网络功能在实际应用过程中,避免了不必要的网络中转,但服务间的调用依赖、访问追踪、性能分析、故障定位等也成为运维保障侧的新挑战。

5GC网络功能服务监控保障实践在5G核心网建设可扩展的网络功能服务NFS监控平台,应对功能拆分解耦后各类资源间网络性能分析,支持IPv4、IPv6协议环境,紧密结合http v2协议,实现服务间关联依赖监控。本文基于运营商实际5GC运行环境的实践,同时为简化环境且直观归纳重点,以Free5GC为环境基础进行介绍。

Free5GC是5G核心网开源软件项目,总体架构基于3GPP标准、遵循SBA框架,采用虚拟化方式实现网络功能,可运行5G核心网的标准服务,并且可以模拟相应工作流程。在实际5G环境中,多数厂商已经采用容器技术承载网络功能服务,所以在本实践中采用虚拟机运行容器,创建Kubernetes集群, 搭建5G核心网验证环境,使能各网络功能。通过云杉网络的DeepFlow平台实现对各网络服务的监控保障,5G核心网监控方案如图1所示,实践过程中部署的组件包括控制器、采集器以及数据节点。

1614839283610013267.png

图1 5G核心网监控方案

由大到小追踪网络服务在5G核心网的监控实践中,由大到小,逐级有序地展示服务运行状态及关联关系。通常根据工作流程分为三大范围,较大范围以数据中心所属区域或资源池划分,其次为网络功能或服务类型,比如AMF、UDM、SMF等,最后将集中在IT单元,比如容器POD、宿主机、IP等。DeepFlow平台按照三类范围由大到小的操作划分,为核心网所涉及的复杂网络提供完整的、逐级的监控跟踪。图2是各类型网络功能服务运行及调用关系全景视图,将服务接口(SBI)中的网络各功能间的调用通信,以及性能指标进行自动绘制并呈现。

1614839283744029034.png

图2 功能服务全景图

在实践过程中,关注服务间重点指标,包括网络层(吞吐、载荷)、传输层(并发连接、TCP建连时延、TCP系统时延,TCP重传、建连失败)、应用层(Http请求、Http时延、Http异常),绘制访问调用关系全景视图后,在知识图谱功能支持下,可以迅速关联列举相应的知识维度。

分钟级定位异常边界范围5G核心网中存在大量的、复杂的NFS间服务调用,因此,具备有效的调用性能跟踪能力尤为重要。

1614839283712040040.png

图3 服务间访问示例

如图3所示,这是一个简单的逻辑调用,AMF(Access and Mobility Management Function)中的NFS调用UDM(Unified Data Management)中的NFS获取用户信息,在此过程中,并不是像传统环境中直观简单。在5G现网环境中,普遍涉及宿主机、虚拟机、容器的网络虚拟化实现,以全栈分段来梳理访问调用,是应对新环境运维排障挑战所必须具备的。以全栈视角,展开以上调用,可以剖析NFS发起调用所经过的POD接口、虚拟机接口、宿主机接口乃至网关等链路。

1614839283580052932.png

图4 服务调用全栈跟踪示意图

全栈跟踪针对云中服务间的调用访问,将虚拟化所实现的逻辑通信进行逐步展开,清晰便捷展示每段的网络状态、性能,结合知识图谱及丰富的指标数据,快速定位性能异常的问题范围边界。以上述访问为例,如果排查调用延时故障,确定NFS调用服务双端后,展开全栈跟踪,直接定位延时所在的接口。服务调用全栈跟踪如图4所示,图中清晰展示出AMF服务实例至UDM服务实例两端访问延时瓶颈在UDM功能侧,且聚焦在其运行所属虚拟机的虚拟网络接口处。而排除UDM服务实例的POD网络接口及AMF所涵盖的虚拟机、POD等众多接口路径。

1614839269024017075.png

图5 全栈跟踪示例

在没有DeepFlow全栈跟踪工具的情况下,排查服务访问调用的性能将是一个复杂繁琐并且冗长的过程,同时对于一线运维人员要求所掌握的技术栈较多、综合能力强,很可能耽误宝贵的运维窗口时间。

图5中Free5GC示例运行在实验室环境,模拟运行了相应的测试用例,实际生产场景较实验室环境更加复杂且规模巨大,势必对运维保障提出更高要求。经过实际环境测试验证,DeepFlow平台也确实能为5G核心网填补保障空白。

DeepFlow是一款面向5G核心网,应对网络功能服务(NFS)分拆解耦后的新挑战,进行流量采集获取、分发、可视化与监控保障的产品,可以帮助5G核心网在基于服务架构中统一采集服务间的网络流量,实现对访问调用的全面性能监控,并提供容器化后的全栈路径跟踪,补齐5G核心网服务监控空白,应对云原生特点,紧密结合5G服务,解决5G核心网生产中遇到的监控、运维、保障等难题。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容