无线智能运维管理创新方案

作者:华为技术有限公司 责任编辑:朱文凤 2023.08.23 10:06 来源:通信世界全媒体

行业挑战

在日常故障的实际处理过程中,华为联合河南移动分析当前运维的核心痛点问题:

● 每天有大量告警上报到省公司监控中心,经过告警预处理后,按规则创建工单并派单。在海量告警中,由于同一个故障往往会产生多条告警,因此部分工单故障同源或者存在关联关系,重复派单导致无效上站;

 现网2G/4G/5G多制式混杂,网络复杂性增加,告警之间相互依赖,难以识别告警之间的关联性,导致故障定位难度大。同时故障发生时告警量较多,存在较多衍生告警和重复告警,派发大量无效工单;

故障处理多依赖现场经验,对处理人员能力要求较高。故障处理自动化、根因定位准确性有待提升,故障处理和资源调度效率偏低,导致故障定位困难,严重影响排障效率,网络运维OPEX居高不下。

项目解决方案

智能故障管理以告警智能压缩、根因精确定位为目标,通过“时间&空间的相关性计算和聚类”算法,精准关联相关告警,识别根源告警,依托“AI+故障树根因告警”算法,定位告警关键因素,提升故障处理效率,并形成专家经验不断扩充故障树,实现问题“诊断准”,关键能力如下:

05-附件-项目方案-无线智能运维管理创新方案464.png

告警压缩:基于EFPG告警时空关联算法挖掘故障模式汇聚相关告警,使用随机森林算法识别根因告警,实现冗余告警和工单压缩20%+。

故障识别:智能故障管理针对网络中发生的告警进行监控,通过时间相关性和空间相关性,对告警进行关联分析,将同一故障原因导致的多个告警汇聚在一起,生成一个网络事件(Incident),对于网络中的故障场景实现从告警到Incident的聚合,这个过程叫做故障识别,智能故障识别基于专家经验找到告警之间的直接关联关系,并利用随机森林算法找到告警之间的间接关系,最终形成树性拓扑,树的根节点即为根告警,也是故障的根因告警。

05-附件-项目方案-无线智能运维管理创新方案736.png

智能故障诊断:结合网元辅助诊断、故障树叠加因果/逻辑/拓扑等推理关系的智能告警故障树和针对无源故障结合多维数据源进行定界/定位概率判定的概率决策模型,实现故障智能定界定因,准确度80%+。

项目应用情况和价值概述

河南移动联合华为,将华为智能故障识别和诊断能力对接到生产系统,通过工单流转流程对比、工单验证比对分析、诊断结果准确性校验,上站实际跟单验证及E2E整体成效验证,并完成多轮工单效果比对,达到预期效果。

05-附件-项目方案-无线智能运维管理创新方案941.png

智能故障嵌入到客户流程后,每月帮助客户减少工单20%+,代维根据诊断信息快速对故障定界定位、一次上站解决故障率明显提升,新手在整个故障处理过程中效率提升1/3,全省故障工单处理效率提升30%。

05-附件-项目方案-无线智能运维管理创新方案1041.png

在当前验证的基站脱管退服、小区退服、前传网络故障TOP3故障场景下,智能故障识别降工单效果明显,根因告警标识精确。故障工单匹配率100%,全省推广使用智能故障管理后,预计可以每月全省可减少8000+工单,整体故障自动化诊断能力提升36.8%;


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容