通信世界网消息(CWW)目前,产业界已经就自智网络的发展愿景、目标架构、代际特征等达成初步共识,但对于未来向高阶自智网络进一步演进,产业共识度仍然不足,缺乏统一的分级评估方法和明确的演进路径,缺少权威的测评规范以衡量并推动商业价值转化。
中国移动作为全球最大的电信运营商,在业界首创并积极探索“能力与成效双向驱动”的自智网络评估方法与建设实践,在增强运维效率、降低运营成本、提升网络质量方面取得显著成效。在此基础上,中国移动联合产业界共同探索,从标准、开源、算法、数据、应用等方面推动自智网络的发展。
网络自智目标愿景作为通信网络运维数智化转型目标,自智网络面向消费者和垂直行业用户提供“零等待”“零接触”“零故障”的创新网络服务与ICT业务,打造自配置、自修复、自优化的通信网络。
一方面,从用户视角实现“三零”数字化体验:开通“零等待”,通过对资源的精准掌控,实现业务的实时开通、即购即用;业务“零故障”,通过对网络的端到端监控,先于用户投诉识别隐患,先于用户感知恢复故障;服务“零接触”,通过网络数据与能力开放,支撑用户自助服务,通过线上数字化方式快速响应用户需求。
另一方面,从运维视角推进“三自”数字化转型:自配置,网络扩容、升级配置自动化,无感知操作,实现网络变更后的自动拨测与机器值守;自修复,敏锐感知网络故障与亚健康状态,基于动态负载均衡、多级容灾等技术,实现业务的保障;自优化,基于大数据和AI技术,实现业务质差的精准感知和识别,实现调优策略的动态生成和闭环控制,确保用户对业务的优质体验。
自智网络核心能力如图1所示,自智网络在传统的通信网络分层分域管理架构基础上,引入自动闭环、自治域与AI能力,通过构建人机协同的认知能力体系,逐步提升网络自智水平。
图1 自智网络体系架构
自动闭环
作为实现自动化的基础,闭环是一个反馈驱动的过程,通过感知、分析、决策、执行4个环节,寻求实现显式设定的意图目标或维持自动执行确定的规则/策略指令。
根据自智网络各层不同应用场景下对闭环处理时效性的要求,可以分别应用自治域内的快速闭环和涉及跨层交互协同的慢速闭环。
自治域
通过与人协作或完全自主驱动,执行一个或多个完整闭环的系统,称为一个“自治域”。作为自智网络的最小组成单位,每个自治域按照业务目标以自运营的方式运行,对自治域的用户隐藏域的实现、操作,以及域元素的功能细节。多个自治域实例可以通过闭环管理接口与上层业务操作协同,完成网络/ICT业务的生命周期。
认知体系
在自治域内闭环执行过程中,系统自智级别(即人与系统的分工界面),取决于系统对闭环执行逻辑与所处环境及其演变规律的认知能力。参考知识管理的基础模型DIKW体系(数据、信息、知识、智慧的金字塔形层次体系),从L1到L5分级逐步提升系统认知能力:从L0“know nothing”, L1“know what”, L3“know how”, L4“know why”到L5“know All”,最终实现完全自治。
如图2所示,认知能力取决于系统中所处级别,自治域通过静态规则(L2)、动态策略(L3)、目标意图(L4)来开放相关自动闭环的管理接口。
图2 自智网络认知能力体系
AI能力
自智网络的高级认知能力构建离不开人工智能技术。考虑到网络和管理系统的层次化特点,以及AI应用各阶段(知识获取、训练、推理)对IT资源的需求差异,需要在网络中构建分布式AI能力:对内支持每一层AI驱动的自动闭环,实现不同场景的智能化,最终实现网络完全自治;对外赋能各行各业网络、服务、市场、安全和管理等场景的人工智能规模化应用需求。
在自智网络中,AI能力将体现为3类形态:集中能力,作为训练平台、知识中心,提供模型训练服务、数字化知识,支撑慢速闭环的在线推理;分布能力,实现具体领域模型和推理应用、本地知识优化,支撑自治域内快速闭环;内嵌能力,指设备内置的AI能力,支持设备本地的AI计算。
自智网络分级方法整体框架与设计原则2019年TM Forum率先提出基于认知闭环的分级评估框架,以及商业价值与技术成熟度组合的能力建设应用“漏斗”模型,为探索自智网络能力建设的分级路径提供了重要参考。
以此为基础,面向现网应用的自智网络能力评级方案或制定总体上遵循两个原则。
一是目标驱动原则。能力评级的最终目的是推动并指导自智网络建设和部署,以评促建;从提升运维效率、提升用户体验两个角度出发,评级服务于提升技术投入的最终成效。
二是实践驱动原则。自智网络的建设部署是在现网基础上进行分级分域的能力演进,而不是推倒重建一套全新的网络网管。因此,能力评级方法的确认和迭代均应以实践为基准,将实际系统能力作为评估对象得出能力评定结果,用于后续指导能力提升的参考。
面向价值的成效指标依据目标驱动原则,以提升用户体验感知、运维生产效率为牵引,以“三零、三自”和闭环表格为基本框架,遵循正相关、客观性原则,建立覆盖网络全生命周期且易从系统直接获取的成效指标体系,用于端到端地衡量AN实际部署成效,帮助运营商从OAM、用户及业务角度衡量系统自动化升级后带来的好处。
正相关:指标正向引导自智网络能力的提升,即自智网络的提升能够有效支撑效能指标的提升。
客观性:成效指标的结果基本不受人为主观因素的影响,或者主观影响是可控的或可识别的。
面向系统的能力评估●第一步:确定评估对象 根据成效指标所涉及的业务类型与网络基础设施,结合运营商现有网络生命周期管理全流程梳理提炼出核心能力,以核心能力作为评估对象,每个评估对象对应且仅对应一个IT系统/管理责任主体。再将每项核心能力分别结合运营业务类型和网络专业技术形成细分场景,细分场景是具备特定上下文的评估对象,是评估的最小打分单元。
运营商可以根据自己的专业和业务需求设计场景,场景设置要牵引走向自动化、智能化,与L0-L5的演进方向保持一致。优先选取正在发展的网元和业务,避免不发展或者退网的网元和业务。场景的划分应该聚焦在专业/业务的重点场景,而不是覆盖所有场景。
●第二步:制定技术规范针对评估对象所涉及具体软硬件实现系统,根据现网实际状况分专业、分系统制定相关技术规范,推动网元设备、网管系统、通用能力平台等相关提供商的软硬件系统产品实现协同规划与协同交付,确保端到端成效指标和基础能力提升的实现。
●第三步:明确代际特征 从指导系统实现角度出发,参考DIKW体系,针对系统认知能力逐步构建,定义通用代际特征。以此为基础,结合评估对象具体细分场景上下文给出各级别要求的清晰、无歧义、可操作的详细定义,如表1所示。
表1 自智网络级别特征
●第四步:执行量化评估依据第二步中定义的技术成熟度原则对每个细分场景进行定性评估后,计算每个核心能力包含的所有细分场景的平均等级,作为该核心能力的得分。被评估网络的等级是按其全部核心能力的平均得分划分的。
●第五步:识别能力短板结合成效指标,根据量化评估结果进行短板分析,确定系统核心能力与闭环中的短板。由于每个核心能力明确对应管理责任主体,由管理责任主体负责该能力的后续改进和提升。
自智网络建设实践作为世界上最庞大、最复杂的通信网络运营者,中国移动运维成本高企,对内提质降本,对外赋能增收的运维数智化转型需求迫切,并为此设定2025年全网达到L4高级自智的整体目标。
为快速实现大规模复杂网络的能力提升,中国移动践行“分而治之”的整体方法论。在空间维度上,从跨域网络运维层次切入拉通上下层,实现资源、业务和用户管理3个闭环,协同网元、网络、业务、商务4个层次的自智能力。在时间维度上,以年为周期,通过产业推进、顶层设计、能力建设和评估分析4个步骤的循环,驱动能力建设的闭环迭代。
为了进行体系化能力建设,中国移动参考业界先进的“中台”理念,定义新一代网管系统架构,制定详细的系统功能规范,指导31个省公司进行全面大规模能力建设;引入AI技术中台,提供通用的算力、算法和数据集,围绕图像识别、复杂计算、大数据分析等3类运维场景,构建感知、诊断、预测、控制4类共性AI能力,推进跨省共享,加速复制推广。
在实操层面,应用上述“面向流程的场景化分级模型”作为核心工具,从网络专业、业务类型和运营流程三个维度建立评估模型,明确数字化、自动化、智能化的分阶段能力提升路径,二者结合后映射到实际现网运维流程中,梳理出11个核心场景、37项核心自智能力,再对应到五大专业、10余种业务,综合得到1300余个子场景,作为自智能力的评估与建设对象。
以此为基础,2021年中国移动启动业界首个自智网络的大规模现网实践:3月组织全网能力评测,针对所识别的云网开通等短板,4月完成网管系统规范的针对性补充与修订;同时联合部分省份开展网络智能化平台试点,通过自研“九天”平台,向各省级子网提供通用AI能力。
截至2021年底,中国移动全面提升网元、OMC、网管系统的数智化运维能力,全网自智网络水平提升至L2.1,真正实现以评促建,并在以下方面取得突出进展。
●无线运维能力持续加强
推动全网基站支持4G/5G载波关断、通道关断、符号关断等基础节能原子能力,能效优化能力快速提升。推动OMC具备MR/CHR数据的实时采集和上报,支撑网络精准优化。梳理完善自动化运维规则,无线运维工作台不断强化自动分析、自动配置能力。
●政企业务开通能力大幅提升
全网建设业务编排系统,实现重点业务开通流程的自动编排、全程可视、审核环节简化,5G专网业务开通时长从1个月缩减到2周,云互联业务实现分钟级开通。
●AI技术在关键运维场景“破冰”
基于集中化AI平台推动全网AI能力集中共享,在入网验收、装维质检、哑资源维护等场景取得应用突破。技术中台AI领域已成功部署175项网络域AI能力,覆盖网络全生命周期的“规建维优营资”核心场景,包括5G基站智能验收、网络隐患预防预测、端到端业务质量智能优化、网络哑资源智能识别等,日均调用量超过60亿次。持续推动AI能力赋能政务等垂直领域,大幅降低省公司重复研发成本,加速应用成熟。
面向未来新展望中国移动自智网络建设相关实践虽已进入体系化部署阶段,但比照全面建设高级自智网络的目标,仍有不小的差距。特别是如何与演进中的5G-Advanced网络能力相结合,支撑算力网络等新兴业务场景方面,尚缺乏明确的产业引导。
2021年4月,第一批5G-Advanced相关项目在3GPP获批。 Release 18 是 5G-Advanced 的第一个版本,标志着5G-A时代即将到来。融合通信与感知技术、确定性传输技术、支持新兴XR业务的跨层网管、5G+AI、算力网络等,已成为赋能5G-A愿景和把握新市场机遇的最有潜力的技术。
首先,演进中的网络能力给自智网络运维智能化带来了新的机遇与挑战:一方面,通感一体化技术增强网络对外部环境的感知能力,为自智网络的内部效率提升和外部业务赋能提供了挖掘新数据价值的潜在应用场景;另一方面,确定性网络能力等网络增强不仅为自智网络资源调度提供了更大的灵活性,也增加了复杂度,需要进一步提升面向业务意图调度资源保障体验的智能化水平。
其次,网络能力增强需要进一步促进自智网络在网元层次与AI技术的深度融合,AI for 5G需要面向运维智能化,还要面向网络自身智能化提供AI能力规模运营的能力,当前的5G技术创新和自智网络应用实践聚焦的方向。而算力网络进一步将5G+云 for AI作为其核心业务场景,对自智网络提出了综合网络中分布式AI算力资源与网络连接资源进行统一管理、智能调度与标准开放的新需求。
面向未来,中国移动将继续发挥在国际标准、开源社区和产业协作中的影响力,结合公司网络运营体系改革、运维自动化能力提升积累的经验,为网络运营商、设备厂商、解决方案提供商的自智网络联合创新和应用实践,搭建开放创新平台。