基于核的降维和分类方法及其应用研究

线性判别分析论文 光束角论文 模糊技术论文 核密度估计论文 熵理论论文 隐私保护论文
论文详情
特征降维和模式分类是模式识别研究的重要内容。目前,特征降维和模式分类方法受到广大学者的关注。特别是近年来核方法的快速发展,使传统方法的适用范围进一步扩大并形成了众多研究成果,广泛应用于数据挖掘、图像处理、语音识别、指纹识别、医疗诊断等领域。尽管如此,但上述方法在一定程度上仍面临鲁棒性不高、泛化能力不强等问题。针对上述问题,本课题进行了相关研究,具体研究内容如下:1、针对线性判别分析算法面临的秩限制和小样本问题,提出几种改进算法:基于多阶矩阵组合的线性判别分析算法MLDA引入多阶矩阵组合的概念,重新定义了传统LDA中的类内离散度矩阵,使传统Fisher准则具有更好的健壮性和适应性;标量化的线性判别分析算法SLDA将类内离散度矩阵和类间离散度矩阵进行标量化处理,通过求解样本各维的权值达到特征降维的目的;基于矩阵指数的线性判别分析算法MELDA在矩阵指数的基础上,重新定义了类内离散度矩阵和类间离散度矩阵,可有效地同时提取类内离散度矩阵零空间和非零空间中的信息。此外,还从理论上对《核选择和非线性特征提取的双线性分析》一文提出的FKA算法的迭代收敛性进行了分析和探讨,并运用Radermacher复杂性分析法进行了证明。2、当前主流特征提取方法大致有两种研究思路:(1)从高维数据的几何性质出发,根据某种寻优准则得到基于原始空间特征的一组特征数更少的新特征;(2)从降维误差角度出发,保证降维前后数据所呈现的某种偏差达到最小。本课题试图从降维过程中数据分布特征的变化入手,基于广泛使用的Parzen窗核密度估计方法,来审视和揭示Parzen窗估计与典型特征提取方法LPP、LDA和PCA之间的关系,从而说明这些特征提取方法可统一在Parzen窗框架下进行研究,为特征提取方法的研究提供了一个新的视角。3、基于边界的分类方法中,超平面、超(椭)球等几何形状运用较为广泛。空间几何另一重要组成部分——点能否作为分类依据值得研究。受空间几何知识和光学领域光束角启发,提出基于光束角思想的最大间隔学习机BAMLM。从光学角度BAMLM可理解为在样本空间中寻找一个“光源”分别照射两类样本,根据照射区域的不同对样本进行分类;从空间几何角度BAMLM可理解为在样本空间内寻找一个分类点,通过计算样本与分类点间的夹角来判断样本类属。分析表明BAMLM的核化形式等价于核化CCMEB,通过引入核心向量机将BAMLM扩展为BACVM,有效地解决了大规模样本的分类问题。然而当训练样本中含有噪声点和孤立点时,上述方法的分类性能受到很大影响。鉴于此,提出基于空间点的最大间隔模糊分类器MFC。该方法引入模糊技术保证MFC分类时对样本区别对待,减小或消除奇异点的影响,有效提高了分类效率。4、针对核SVM存在的信息泄露问题和大规模数据分类问题,提出面向大规模数据的隐私保护学习机PPLM和基于分类超平面的非线性集成学习机NALM。PPLM首先通过核心向量机对大规模样本进行采样,然后在核心集上选取两个样本点并将两点连线的法平面作为最优分类面。该方法有效解决大规模数据分类问题,并保证分类过程隐私安全。NALM首先将数据集分成若干数据子集,然后分别在各数据子集上运行分类超平面SH,最后将各子集上的分类结果进行集成得到最终的分类结果。该方法不仅继承了SH的优点,而且还将SH的适用范围从小规模数据扩展到中大规模数据,从线性空间推广到Hilbert核空间。5、以SVM及其变种为代表的大间隔分类方法在实际应用中取得了较好的效果,但该方法易受到输入数据仿射或伸缩等变换的干扰,其原因在于这些方法只考虑数据类间的绝对间隔而忽视了类内数据的分布性状。针对大间隔分类方法的不足,提出基于核密度估计与熵理论的最大间隔学习机MEKLM。该方法用核密度估计表征样本的分布特征,用熵表征分类的不确定性。MEKLM可以真实反映类间数据的边界信息和类内数据的分布特征,同时解决二分类问题和单类问题,且分类性能优良。
摘要第3-5页
Abstract第5-6页
第一章 绪论第11-17页
    1.1 课题研究背景第11-14页
        1.1.1 特征降维方法第11-12页
        1.1.2 模式分类方法第12-13页
        1.1.3 核第13-14页
    1.2 特征降维和模式分类面临的几个挑战第14-15页
    1.3 课题主要内容、特色和创新第15-17页
第二章 基于线性判别分析算法的特征降维方法研究第17-45页
    2.1 引言第17页
    2.2 线性判别分析算法及其面临的两大问题第17-18页
        2.2.1 线性判别分析算法第17-18页
        2.2.2 秩限制问题第18页
        2.2.3 小样本问题第18页
    2.3 基于多阶矩阵组合的线性判别分析算法 MLDA第18-24页
        2.3.1 算法描述第18-19页
        2.3.2 实验结果及分析第19-24页
    2.4 标量化的线性判别分析算法 SLDA第24-31页
        2.4.1 提出 SLDA 的意义第24-25页
        2.4.2 算法描述第25-26页
        2.4.3 实验结果及分析第26-31页
    2.5 基于矩阵指数的线性判别分析算法 MELDA第31-36页
        2.5.1 算法描述第31-32页
        2.5.2 实验结果及分析第32-36页
    2.6 FKA 算法迭代收敛性分析第36-42页
        2.6.1 引言第36页
        2.6.2 FKC 准则及迭代分析算法 FKA第36-38页
        2.6.3 FKA 算法迭代收敛性分析第38-42页
        2.6.4 推广性结论第42页
    2.7 结语第42-45页
第三章 特征提取新视角:基于 Parzen 窗估计的方法第45-61页
    3.1 引言第45页
    3.2 Parzen 窗第45-46页
    3.3 Parzen 窗与 LPP第46-49页
        3.3.1 LPP第46-47页
        3.3.2 Parzen 窗与 LPP 的关系第47-49页
    3.4 Parzen 窗与 LDA 和 PCA第49-54页
        3.4.1 LDA第49-51页
        3.4.2 Parzen 窗与 LDA 的关系第51-52页
        3.4.3 PCA第52-54页
        3.4.4 Parzen 窗与 PCA 的关系第54页
    3.5 实验分析第54-60页
        3.5.1 人工数据集第55-56页
        3.5.2 人脸数据集第56-60页
    3.6 推广性结论第60页
    3.7 结语第60-61页
第四章 基于光束角思想的最大间隔学习机第61-77页
    4.1 引言第61页
    4.2 背景知识第61-63页
        4.2.1 光束角第61-62页
        4.2.2 相关算法第62-63页
    4.3 基于光束角思想的最大间隔学习机第63-66页
        4.3.1 BAMLM 与光束角的关系第63-64页
        4.3.2 线性形式第64-65页
        4.3.3 对偶形式第65页
        4.3.4 核化形式第65页
        4.3.5 间隔ρ的求解第65-66页
        4.3.6 决策函数第66页
    4.4 CCMEB 及 BACVM第66-67页
        4.4.1 CCMEB第66-67页
        4.4.2 BAMLM 与 CCMEB 关系第67页
        4.4.3 BACVM第67页
    4.5 实验分析第67-75页
        4.5.1 实验参数分析第68-69页
        4.5.2 中小规模数据集第69-73页
        4.5.3 中大规模数据集第73-75页
    4.6 结语第75-77页
第五章 基于空间点的最大间隔模糊分类器第77-87页
    5.1 引言第77页
    5.2 模糊理论第77-78页
        5.2.1 基于距离的隶属度函数第77页
        5.2.2 基于紧密度的隶属度函数第77-78页
    5.3 最大间隔模糊分类器 MFC第78-80页
        5.3.1 概述第78页
        5.3.2 原始优化问题第78-79页
        5.3.3 对偶问题第79页
        5.3.4 核化问题第79-80页
        5.3.5 类间夹角间隔ρ的求解第80页
        5.3.6 决策函数第80页
    5.4 理论分析第80-81页
        5.4.1 可调参数 性质第80-81页
        5.4.2 单类问题第81页
    5.5 实验分析第81-85页
        5.5.1 实验参数设置第81-82页
        5.5.2 二类模式分类第82-83页
        5.5.3 单类模式分类第83-84页
        5.5.4 抗噪性实验第84-85页
    5.6 结语第85-87页
第六章 基于分类超平面的大规模数据学习机第87-101页
    6.1 引言第87-88页
    6.2 面向大规模数据的隐私保护学习机第88-95页
        6.2.1 支持向量机及隐私泄露问题第88-89页
        6.2.2 PPLM第89-91页
        6.2.3 实验分析第91-95页
    6.3 基于分类超平面的非线性集成学习机第95-99页
        6.3.1 算法描述第95-96页
        6.3.2 数据集划分方法第96页
        6.3.3 非线性集成方法第96页
        6.3.4 实验分析第96-99页
    6.4 结语第99-101页
第七章 基于核密度估计与熵理论的最大间隔学习机第101-111页
    7.1 引言第101页
    7.2 核密度估计和熵理论第101-102页
        7.2.1 核密度估计第101-102页
        7.2.2 熵理论第102页
    7.3 基于核密度估计与熵理论的最大间隔学习机第102-104页
        7.3.1 分类目标函数第102-103页
        7.3.2 决策函数第103-104页
    7.4 理论分析第104-105页
        7.4.1 先验系数λ的性质第104-105页
        7.4.2 单类问题第105页
    7.5 实验分析第105-108页
        7.5.1 实验参数的设置第105-106页
        7.5.2 人工数据集第106-107页
        7.5.3 UCI 数据集第107-108页
    7.6 结语第108-111页
第八章 总结与展望第111-113页
    8.1 本课题的主要贡献第111-112页
    8.2 工作展望第112-113页
致谢第113-115页
参考文献第115-123页
附录第123页
    附录 1:作者在攻读博士学位期间发表的论文列表第123页
    附录 2:攻读博士学位期间参与的科研项目列表第123页
论文购买
论文编号ABS2384496,这篇论文共123页
会员购买按0.30元/页下载,共需支付36.9
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付61.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656