面向不平衡数据集的分类算法研究及其在通信智能运营方面的应用

不平衡数据集论文 分类算法论文 SMOTE论文 k最近邻算法论文
论文详情
移动互联网的发展促使通信运营商将原有的以网络为核心的通信运营模式改变为以客户体验为中心的新型价值模式,通过数据挖掘实现以客户体验管理为中心的通信智能运营已经成为一种必然的趋势。通信智能运营中的客户流失预警和终端精准营销是典型的不平衡数据分类问题,因此,面向不平衡数据集的分类算法研究及其在通信智能运营中的应用具有实用意义。本文针对不平衡数据集的分类算法进行研究,所做的主要研究工作包括以下方面:首先,为解决不平衡数据集的分类问题,提出了一种基于近邻样本分布和泊松分布的改进合成少数类过采样(SMOTE:Synthetic Minority Oversampling Technique)算法,针对 SMOTE 算法生成新样本时不考虑数据分布、生成新样本过程不可控、丢弃多数类信息的问题,在生成新样本的时候引进和数据分布有关的参数,对合成样本的偏离程度进行有效调节,仿真结果验证了所提算法的有效性;其次,针对k最近邻(kNN:k-Nearest Neighbor)分类算法的算法复杂度过高的问题,提出了一种基于预分类的kNN改进算法(kP:kNN algorithm based on Pre-classification),通过删除数据集中特征不明显的数据样本来减少算法时间复杂度,仿真结果验证了所提算法的有效性。最后,从通信智能运营实际应用的角度出发,针对客户流失数据和终端营销数据,采用基于近邻样本分布和泊松分布的改进SMOTE算法(SPDDN:SMOTE algorithm based on Poisson Distribution and the Distribution of Neighborhoods)和kP算法进行数据挖掘和分析,验证了上述所提算法的有效性,为通信智能运营中面向不平衡数据集的分类方法提供了有效的解决方案。
摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-12页
    1.2 面向不平衡数据集的分类预测算法的研究现状第12-13页
    1.3 本文研究内容及文章结构第13-16页
第二章 不平衡数据集与分类算法第16-25页
    2.1 分类算法概述第16-17页
    2.2 分类算法性能评估第17-21页
        2.2.1 ROC曲线第18页
        2.2.2 AUC第18-19页
        2.2.3 基分类器第19-20页
        2.2.4 集成分类算法第20-21页
    2.3 不平衡数据集第21页
    2.4 不平衡数据集的分类难点第21-22页
    2.5 不平衡数据集的处理方法第22-24页
        2.5.1 基于数据层面的不平衡数据处理策略第23-24页
        2.5.2 基于算法层面的不平衡数据处理策略第24页
    2.6 本章小结第24-25页
第三章 基于近邻样本分布和泊松分布的改进SMOTE算法第25-34页
    3.1 现有的SMOTE及其改进算法第25-26页
    3.2 SPDDN算法第26-30页
        3.2.1 算法改进第26-27页
        3.2.2 SPDDN算法步骤第27-30页
    3.3 算法性能评估第30-33页
    3.4 本章小结第33-34页
第四章 基于预分类的改进kNN算法第34-46页
    4.1 kNN算法第34-37页
    4.2 kP算法第37-38页
        4.2.1 算法改进第37页
        4.2.2 kP算法步骤第37-38页
    4.3 算法性能评估第38-45页
    4.4 本章小结第45-46页
第五章 基于不平衡数据集分类预测算法在通信智能运营方面的应用第46-53页
    5.1 分类预测算法在通信智能运营方面的应用需求分析第46-47页
        5.1.1 客户流失数据方面的应用需求分析第46页
        5.1.2 终端营销数据方面的应用需求分析第46-47页
    5.2 通信智能运营数据集及其预处理第47-49页
        5.2.1 通信运营数据集的特点第47页
        5.2.2 通信运营数据集的预处理第47-49页
    5.3 基于不平衡数据集的通信智能运营模型第49-50页
        5.3.1 客户流失预警模型第49-50页
        5.3.2 终端精准营销预测模型第50页
    5.4 MIOCUD模型的性能评估第50-52页
        5.4.1 客户流失预警模型的性能评估第50-51页
        5.4.2 终端营销模型的性能评估第51-52页
    5.5 本章小结第52-53页
第六章 论文研究工作总结与下一步研究工作展望第53-54页
    6.1 论文研究工作总结第53页
    6.2 下一步研究工作展望第53-54页
参考文献第54-58页
致谢第58-59页
攻读学位期间的学术成果第59页
论文购买
论文编号ABS4091642,这篇论文共59页
会员购买按0.30元/页下载,共需支付17.7
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付29.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656