搜索 分析 新世界 法规 图书 网址导航 更多
高级用户登录 | 登录 | |

一种基于隐马尔可夫模型的移动通信用户流失预测方法
审中-实审
著录变更

申请号:201510741904.4 申请日:2015-11-04
摘要:本发明公开一种基于隐马尔可夫模型的移动通信用户流失预测方法,属于数据业务领域。采集移动用户的通信记录数据;数据预处理;建立隐马尔可夫模型;对观测状态节点对应的数据进行处理;利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;各步骤均是在hadoop大数据平台上完成。本发明在大数据Hadoop分布式平台上对通信数据进行分析并预测,充分利用大数据的优势,对移动通信用户的所有数据进行分析,提升了预测移动通信用户流失的准确性和高效性。
申请人: 东北大学
地址: 110819 辽宁省沈阳市和平区文化路3号巷11号
发明(设计)人: 于端云 顾宁伦 才鑫 曾令兵 夏兴有
主分类号: H04L12/24(2006.01)I
分类号: H04L12/24(2006.01)I
  • 法律状态
2016-05-11  著录事项变更IPC(主分类):H04L 12/24变更事项:发明人变更前:于端云 顾宁伦 才鑫 曾令兵 夏兴有变更后:于瑞云 顾宁伦 才鑫 曾令兵 夏兴有
2016-02-24  实质审查的生效IPC(主分类):H04L 12/24申请日:20151104
2016-01-27  公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
  • 其他信息
主权项  一种基于隐马尔可夫模型的移动通信用户流失预测方法,其特征在于:包括以下步骤且各步骤均是在hadoop大数据平台上完成:步骤1:采集移动用户的通信记录数据;步骤2:数据预处理;基于移动用户的通信记录数据,以月为单位,按照下述8种属性类别对移动用户的通信情况进行统计:(1)计费用户号码;(2)月通话时长;(3)月通话次数;(4)月主被叫比例;(5)月漫游次数;(6)月掉话次数;(7)月基本费用;(8)月长途费用;步骤3:建立隐马尔可夫模型,以下简称HMM模型;定义HMM模型中的观测状态节点集合Ssum={S0,S1,...,S6}对应{月通话时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用};隐状态节点X={0,1},其中0代表客户流失状态,1代表客户未流失状态;步骤4:对观测状态节点对应的数据进行处理;步骤4.1:将观测状态节点对应的静态数据转换成趋势数据;利用公式(1)将观测状态节点的静态数据转换成趋势数据;<mrow><msubsup><mi>Y</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mrow><mo>-</mo><mn>1</mn><mo>,</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><mrow><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0</mn></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mn>0</mn><mo>,</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>&lt;</mo><mo>-</mo><mover><msub><mi>S</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover></mrow></mtd></mtr><mtr><mtd><mrow><mn>1</mn><mo>,</mo><mo>|</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>|</mo><mo>&lt;</mo><mover><msub><mi>S</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover></mrow></mtd></mtr><mtr><mtd><mrow><mn>1</mn><mo>,</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><mrow><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0</mn></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mn>2</mn><mo>,</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>&gt;</mo><mover><msub><mi>S</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>其中i的取值范围0~6;表示观测状态节点Si在第t个月的数据值;表示转换后的观测状态节点Si在第t个月的趋势状态数据;?1表示该用户这个月没有通信数据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该用户这个月的通信数据上升;步骤4.2:将多个观测状态节点压缩成一个观测状态节点;利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2)所示;步骤5:基于建立的HMM模型进行移动用户流失预测;利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;具体包括如下步骤:步骤5.1:利用步骤1至步骤4的方法获得T个月观测状态节点的趋势状态数据;步骤5.2:初始化HMM模型参数λ=(A,B,π),并设置t=0;步骤5.3:通过第t个月的隐状态节点X的概率分布Bel(Xt),利用隐状态节点概率转移矩阵A计算第t+1个月隐状态节点X的概率分布其中Bel(Xt)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+1|Xt)表示隐状态节点X在第t个月转移到第t+1个月的概率转移;步骤5.4:使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+1个月隐状态节点X的概率分布得到修正概率分布Bel(Xt+1)∝P(Yt+1|Xt+1)Bel′(Xt+1);其中P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个月的观测状态节点修正第t+1个月的隐状态节点的概率分布;步骤5.5:对第t+1个月的隐状态节点X的修正概率分布进行归一化,使隐状态节点的所有状态的概率和为1;步骤5.6:令t=t+1;步骤5.7:若t<T,跳转执行步骤5.3,否则执行步骤5.8;步骤5.8:利用移动通信用户第T个月隐状态节点X的概率分布Bel(XT),通过隐状态节点概率转移矩阵A,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分布<mrow><msup><mi>Bel</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msup><mi>X</mi><mrow><mi>T</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>=</mo><munder><mo>&Sigma;</mo><msub><mi>x</mi><mi>T</mi></msub></munder><mi>P</mi><mrow><mo>(</mo><msup><mi>X</mi><mrow><mi>T</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>|</mo><msup><mi>X</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>B</mi><mi>e</mi><mi>l</mi><mrow><mo>(</mo><msup><mi>X</mi><mi>T</mi></msup><mo>)</mo></mrow><mo>.</mo></mrow>
公开号  105281959A
公开日  2016-01-27
专利代理机构  沈阳东大知识产权代理有限公司 21109
代理人  梁焱
颁证日  
优先权  
国际申请  
国际公布  
进入国家日期