多标记分类中的半监督降维和集成学习

多标记分类论文 多标记维度约减论文 半监督判别分析论文 多标记集成论文
论文详情
多标记分类及其应用是当前机器学习和数据挖掘领域的热点问题,其中多标记维度约减和多标记集成分类是非常值得研究和探讨的两个方向。传统机器学习的研究对象是数据样本仅具有一个标记的单标记问题,而本文主要研究样本同时具有多个标记的多标记问题。论文研究了多标记分类、半监督学习、维度约减和集成学习的基本方法及其在各种数据集上的应用,并分别从数据预处理和分类器集成两个角度,研究了如何结合半监督学习对高维多标记数据进行维度约减和如何利用集成学习提高多标记分类的性能。实际中常遇到高维多标记数据仅有少量标记样本而大部分样本却没有标记的情况,为了有效去除冗余特征并使用未标记样本提供的潜在信息,将半监督学习引入到多标记维度约减中,提出基于半监督判别分析的多标记维度约减算法(MSDA)。该算法利用标记样本的属性图加权矩阵和部分标记的相似关联矩阵,最大化不同类别样本之间的分离度,同时使用未标记样本估计原始高维数据在低维数据流行上的内在几何结构。实验表明,MSDA算法在多个分类评价指标上的平均性能均优于其他方法,证实了算法的有效性。针对多标记数据的分类性能不理想的问题,将集成学习引入到多标记分类中,提出一种基于软成对约束投影的多标记集成算法(SPACME)。该算法通过重采样训练样本提供的软成对约束信息建立初始基分类器,利用获得的cannot-link集合和must-link集合构建约束投影矩阵,并将原始数据映射到新的数据空间表示,然后在转换后的数据集上使用权重更新策略迭代地训练一组基分类器以增加差异性,最后对多个基分类器的结果使用多数投票的方法输出标记集。实验表明,SPACME算法利用软成对约束信息明显提高了多标记数据的分类准确率等各项性能,且算法具有良好的健壮性。
摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-17页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-15页
        1.2.1 多标记降维的研究现状第11-12页
        1.2.2 半监督降维的研究现状第12-13页
        1.2.3 集成学习的研究现状第13-15页
    1.3 本文的主要内容及章节安排第15-17页
第二章 多标记分类、半监督学习和维度约减第17-29页
    2.1 多标记分类第17-21页
        2.1.1 问题转化法第18页
        2.1.2 算法自适应法第18-19页
        2.1.3 性能评价指标第19-21页
    2.2 半监督学习第21-24页
    2.3 维度约减第24-28页
        2.3.1 线性维度约减第24-25页
        2.3.2 非线性维度约减第25-28页
        2.3.3 本征维度估计第28页
    2.4 本章小结第28-29页
第三章 基于半监督判别分析的多标记维度约减第29-44页
    3.1 问题引入第29页
    3.2 数学定义第29-30页
    3.3 多标记半监督判别分析MSDA第30-36页
        3.3.1 目标函数推导第30-33页
        3.3.2 求解特征值问题第33-35页
        3.3.3 MSDA算法描述第35页
        3.3.4 算法复杂度分析第35-36页
    3.4 基于核函数的MSDA第36-37页
    3.5 实验第37-43页
        3.5.1 实验环境第37-38页
        3.5.2 数据集描述第38页
        3.5.3 性能评价第38-39页
        3.5.4 实验结果与分析第39-43页
    3.6 本章小结第43-44页
第四章 基于软成对约束投影的多标记集成第44-62页
    4.1 分类中的集成学习第44-45页
    4.2 常见集成学习方法及实验比较第45-47页
        4.2.1 集成学习方法第45-46页
        4.2.2 实验比较第46-47页
    4.3 基于软成对约束的多标记集成算法(SPACME)第47-53页
        4.3.1 问题与算法思路第47-48页
        4.3.2 多标记约束投影第48-49页
        4.3.3 样本权重更新第49-50页
        4.3.4 多标记分类器集成第50页
        4.3.5 SPACME算法过程第50-51页
        4.3.6 SPACME算法伪代码第51页
        4.3.7 算法复杂度分析第51-53页
    4.4 实验第53-61页
        4.4.1 实验环境第53页
        4.4.2 数据集描述第53页
        4.4.3 算法评价第53-54页
        4.4.4 实验设计第54-55页
        4.4.5 实验结果第55-60页
        4.4.6 分析与讨论第60-61页
    4.5 本章小结第61-62页
第五章 总结与展望第62-64页
    5.1 论文工作总结第62-63页
    5.2 未来工作展望第63-64页
附录A 多标记分类的相关实验第64-67页
附录B 维度约减的相关实验第67-72页
参考文献第72-82页
致谢第82-83页
攻读硕士学位期间的主要研究成果第83-84页
论文购买
论文编号ABS977010,这篇论文共84页
会员购买按0.30元/页下载,共需支付25.2
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付42
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656