信通院谈利用神经网络预测用户投诉的方法

作者:中国信息通信研究院融合创新中心 王可争 潘丹 责任编辑:王禹蓉 2021.06.15 15:55 来源:通信世界全媒体

通信世界网消息(CWW)我国移动通信从1993年起,经历了2G到5G的技术革新,2021年5G网络建设进一步铺开,to C和to B应用进入爆发阶段。如今中国移动、中国电信、中国联通均已建成了覆盖范围广、业务速率高的无线网络,中国电信业进入了全业务运营时代,形成了新的竞争格局。现阶段三大运营商通信服务有明显的同质化趋势——相似的用户结构、广泛的网络覆盖、雷同的服务种类、相同的企业性质。在携号转网全面落实、用户空间日益饱和的今天,提高用户黏性成为提升运营商市场竞争力之根本。

提高用户黏性意味着运营商战略方向必须向提高用户业务感知、制定合理的保存量策略以及业务创新3个方面进行调整。制定合理的保存量策略以降低网络自费为主要手段;业务创新需要长期研究用户行为、预测业务趋势,并且需要一定时间的验证和推广;因此,提高用户业务感知成为现网提高用户黏性的最重要手段。

运营商对用户感知的最重要并且最直接的数据收集方式即是用户投诉。正确认识用户投诉是打破电信业同质化竞争局面的原动力。当运营商所提供业务的质量达不到用户预期并超出了用户容忍极限之后,用户通常会将其对服务质量的不满表现在用户行为上。用户的投诉是运营商提升服务水平和产品质量的先导,运营商可以据此对网络质量进行靶向优化。

运营商应通过对用户投诉数据的分析与分类,划分出与用户投诉直接相关的网络指标,通过建立模型实现当网络指标达到或低于该模型容限时进行及时预警,避免用户投诉行为,从根本上提高用户体验,力争建立起“网络质量差—用户投诉—网络质量分析—构建模型—网络质量预警—网络优化—网络质量提升”这一闭环流程。

小区网络质量与用户投诉

用户投诉的定义及现状

用户投诉分为“情绪发泄”和“问题反馈”两个部分。情绪发泄是指用户对企业的产品和服务的内容表示不满意,目的倾向于倾诉,可以通过解释来满足客诉诉求;问题反馈是用户对企业提供的产品或者服务不满足其预期的一种情绪体现和情况反馈。对于运营商来说,问题反馈类的投诉更有分析价值。

运营商保存的投诉数据,数据结构完整,结合入网时间、消费层次、年龄阶段、业务偏好等用户信息,具有巨大的分析价值。如何从纷繁复杂的投诉数据中发现规律、定位问题,并及时跟进处理用户的不满,进而防患于未然,是摆在运营商面前的新问题。但是目前运营商对用户投诉的分析水平普遍较低,对于投诉相关的网络数据资源利用效率低,缺乏对用户投诉的科学、系统研究。

用户投诉的分析方法

目前对于投诉行为预测的方法可以分为两类,一类是定性预测方法,另一类是定量预测方法。定性预测是通过对投诉历史及现状的分析,预判出未来投诉发展的一种或多种可能性,如使用市场调研法。定量预测是利用历史和当前的数据,建立有关的数学模型,对投诉未来发展做出数量预测,通过数学模型来表述投诉发展的规律,定量预测模型的典型代表有时间序列模型和回归模型。

用户投诉数据有一个累积的过程,图1列出广东某地市某年1—5月某运营商网络投诉情况。如果能够分析投诉历史数据,对其中的典型投诉案例进行抽取总结,建立完善投诉案例库,透过表面现象挖掘内在规律,积累投诉经验则可以更好地处理投诉,并有可能未雨绸缪预测即将发生的投诉。

image.png

图 1 某地运营商1—5月网络投诉情况

本文从网络基础信息入手,利用投诉点的经纬度及工参中基站的经纬度、方向角等信息,关联计算投诉点对应的服务小区。结合MR、网络KPI等数据源考察目标小区的RSRP质量、RAB指派成功率、RRC建立成功率、掉话率、时延等覆盖、接入、保持性能指标,通过联合分析得到网络质量与用户投诉之间的关联。最后拟采用人工神经网络评估投诉与小区网络性能的关联,建立起预测模型,输入小区网络KPI,输出小区投诉期望。

用户投诉的网络质量分析

为了分析每个小区的投诉情况,需将投诉详单中的投诉记录定位到服务小区。通过对投诉记录进行分类,筛选出用户投诉的网络因素,对应到投诉定位小区的网络质量,分析出哪些网络质量是影响用户投诉的首要因素,从而建立预测模型,达到预测小区网络质量与用户投诉之间关系的目的。

●用户投诉的网络定位算法

投诉小区定位过程:首先取投诉点与基站连线与正北方向的夹角为基站-投诉点方位角,一个基站可服务多个小区,由不同的小区扰码进行区别,基站的天线中心方向电磁波辐射最强,往两边信号强度逐渐减小,基站的半功率角就是主瓣上,功率下降到最强方向(主瓣方向)一半(3dB)的夹角,常见的水平半功率角为65度,即从主方向往左右各32.5度,功率就下降到一半,该参数反映了天线能量的集中程度,表征天线的覆盖范围,基站的一个水平半波方向角即覆盖一个小区。

投诉点关联基站原理如图2所示,角度Base1_Angle1、Base1_Angle2为基站Base1的两个小区的水平半功率角,Base2_Angle、Base3_Angle分别为基站Base2、Base3两个小区的水平半功率角。Ue_Base1_Angle、Ue_Base2_Angle、Ue_Base3_Angle依次为投诉点与3个基站连线的方向角。

常见的天线水平半功率角为90度和65度,以65度为例,Ue_Base1_Angle<Base1_Angle2-65/2,则此终端在基站Base1小区2的覆盖范围外,同理也不在基站Base1小区1的覆盖范围内。

对于基站Base3的小区,Base3_Angle-65/2<Ue_Base3_Angle<Base3_Angle+65/2,则认为此终端在此小区的覆盖范围内。同理,对于基站Base2, Base2_Angle-65/2<Ue_Base2_Angle<Base2_Angle+65/2,因此该小区也认为可覆盖此终端。这样就筛选出两个小区,为了进一步定位投诉终端的服务小区,可利用投诉点与基站的经纬度信息,计算终端与基站的距离。基站发射的信号强度随距离的增大而减弱,因此选择距离投诉点最近的小区作为其服务小区。如图中所示,Base3距投诉点UE的距离较Base2近,因此选定Base3作为该投诉终端的服务基站,对应的小区作为服务小区。

1623743840847049320.png

图2 投诉点关联基站原理

●用户投诉的网络定位结果

图3为某地运营商5月份网络投诉点与服务小区定位关联运算结果,红色为投诉地点,蓝色为关联运算得到的基站。放大后其细节如图4所示,可见本方法的投诉点定位较为精确。

1623743864786039796.png

用户投诉的分类

不同业务的用户体验不同,引发投诉的原因各异,分类考察不同业务的投诉情况有助于了解用户对不同业务质量的敏感程度。

语音业务、视频电话等会话类型业务对时延要求最高,具有很强的实时性。因此,要求实时会话发生在对等的终端用户之间,业务量对称或者基本对称,且最大时延需满足人们主观对音频、视频的感觉(大约小于200ms)。

移动视频等数据流类型业务是不对称的,对时延要求比会话类型低,允许有较大的时延,但可以通过流式多媒体技术把数据转换成一个稳定均匀且连续的流来处理。对于较大时延引起的抖动,可以通过缓存来平滑,最终需保持业务流中各信息实体的时间关系。

网页浏览等互动类型业务对时延要求更低,采取终端用户请求—响应模式,要求较低的误码率。

电子邮件、短消息、下载服务等后台业务对时延要求最低,允许很大的时延,接收端并不期待数据在短时间内到来,对发送的时间也不太敏感。发送的内容不需要透明传输,但必须无差错接收。

投诉分为语音类、数据类、短信类等3种投诉类型,其中语音类投诉包括掉话/断线、无法接通、单通串话、回音/杂音/断续/摘机无音、忙音等,数据类投诉包括无法上网、上网速度慢、掉线等,短信类投诉包括无法发送、无法接收等。

●用户投诉定位小区的质量分析

通过把用户的投诉定位到小区,就可以对配合小区的网络质量进行分析,例如分析小区网络覆盖质量与用户投诉之间的关联,哪些网络指标直接影响到用户的投诉。通过以上的分析总结,最终可以建立小区潜在投诉概率的预测模型,如果辅以用户信息(如套餐、重要程度、网络质量容忍性等)还可以对用户的潜在投诉进行预测。

投诉定位到小区以后,就可以针对小区的网络质量与投诉情况进行分析。通过唯一字段索引,把投诉小区匹配上所采集到的网络数据。

image.png

为保证覆盖分析的可靠性,MR数据选取了一周内采样点大于2000的小区,如图5所示。经上述投诉小区关联后,语音类投诉目标小区共1127个,目标小区中具有有效MR数据的小区为788个,弱覆盖小区共计489个(弱覆盖小区定义为RSRP<=-110dbm、采样点比例>10%的小区),语音类投诉弱覆盖小区占比62.1%。数据类投诉目标小区1295个,具有有效MR数据的小区为1180个,弱覆盖小区共计915个,数据类投诉弱覆盖小区占比77.5%。

潜在用户投诉的预测模型

通过对小区用户投诉次数以及投诉小区网络MR、网络KPI指标呈现出的网络性能进行深入剖析,结合网络优化中的相关经验,可以利用神经网络预测算法建立起一套预测小区投诉概率的模型。利用该模型可以预测可能被投诉的小区,提前一步指导网络优化的方向。

神经网络预测模型简介

神经网络(Neural Networks, NN)是由大量简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素、不精确的信息处理问题。

BP(Back Propagation)网络是1986年由Rumelhart和McCelland领导的科学家小组提出的一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

潜在用户投诉的预测模型建立

投诉次数集中反映了小区的历史投诉状况,表明网络有缺陷或小区内有易投诉人群;MR、网络KPI等指标体现出的弱覆盖、质差、数据业务感知差等网络问题直接影响用户体验,可能导致用户通话中断、上网掉线等问题,对于这些潜在投诉信息可作为预测模型的输入。

预测模型的输入均为数值,因此需将历史投诉数据中的投诉类型、原因、MR等指标进行数值化。对于历史投诉数据可分为两部分,一部分用于预测模型的训练,另一部分用于模型的测试,验证模型的有效性。

利用神经网络预测小区被投诉概率

因掌握的数据源有限,尤其是历史掉话数据等与投诉相关性较强的指标未能收集到,本方案中投诉预测模型仅在理论上进行了较多探讨,并采用MATLAB实现了一个较为简单的人工神经网络模型用于问题的直观描述。

通过BP神经网络刻画小区特征与投诉值之间的关系,图6为模型结构,网络的输入端为客户投诉的关键因素,输出端即为计算出的小区投诉期望值。

image.png

对此BP神经网络结构中的具体参数设置如下:

一是输入层节点数。输入层起缓冲存储器的作用,把数据源加到网络上。其节点数据取决于特征向量的维数,即我们选择的投诉因素个数,本模型中取6。

二是隐含层数。Hecht-Nielsen层证明了当各节点具有不同的门限时,对于任何封闭区域内的一个连续函数都可以用一个隐含层的网络来逼近,因而一个单层的基于BP算法的神经网络可以完成任意的n维到m维的映射。基于这个理论,本文使用一个隐含层来描述各输入指标与用户投诉之间的关系。

三是层内节点数。对于层内节点数的设定,我们采用“节点数=(输入指标个数+输出层节点数)/2+2”来计算。

四是输出层节点个数。神经网络的最终输出结果为计算出的用户投诉期望值,因此只有一个输出节点。

综合上述分析,用户因感知体验差而投诉,影响用户感知的指标不胜枚举,且指标之间也具有相关性。为了实施预测的便捷,降低模型的复杂度,且不失准确性,本文选择无线接通率、业务掉话率、RAB指派成功率、CSFB 建立成功率、小区RSRP指标(RSRP≥-110dBm的比例)RRC连接建立成功率等关键信息作为小区潜在投诉预测模型的输入。

模型以上述5个指标作为输入,输入层函数采用纯线性变换函数,隐含层函数采用tangsig函数,因为小区投诉期望值为一个0到1之间的数,因此输出层函数采用logsig变换函数,误差评价函数采用MSE,隐层神经元数为5,网络训练使用的函数为trainlm。预测函数最终的输出为目标小区的投诉期望,其值限定在(0,1)范围内,期望越大表示未来一段时间该小区面临投诉的可能性更大,需提请注意。最终构建的BP神经网络如图7所示。

image.png

本文选择100个投诉小区、100个非投诉小区的指标作为训练数据来校正模型,并选择100个投诉小区、100个非投诉小区的指标作为验证数据来检验预测模型的性能。

经过3358个轮回的训练后,在0.001附近网络误差曲线趋于平稳,说明网络已经收敛,网络训练的误差平方和变化曲线如图8所示。

image.png

对100个投诉小区的验证结果如图9所示。

image.png

非投诉小区验证结果如图10所示。

image.png

从验证结果可以看出,投诉小区模型的输出结果(即投诉期望值)较为平稳,这与网络质量的分析结果一致,投诉小区的网络质量(如覆盖、干扰、接入性能)较差。对非投诉小区,模型的输出结果变化较剧烈,对于覆盖、干扰等性能均良好的小区,其投诉期望值明显较低,其他投诉期望值较大的非投诉小区其网络指标与投诉小区没有明显的差别,只是未有历史投诉。据此结果,可设定投诉预警值为0.97,大于预警值的小区可重点关注。

限于模型纳入的数据源有限,预测准确性还有待提高,下一阶段可考虑加入更多网络KPI指标,如掉话信息、网络速率等,进一步完善投诉模型,提高预测精度。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容