鲁棒的大间隔分类学习方法研究
间隔论文 鲁棒性论文 特征选择论文 近邻分类论文 支持向量机论文
论文详情
在机器学习领域中,间隔从距离角度对分类置信度进行刻画,用于估计分类学习算法的泛化错误界和指导分类算法的设计,已广泛的应用于指导特征选择、分类器训练和集成学习。然而传统的大间隔分类学习方法抗噪性差,当训练样本中存在个别大噪声数据时,分类边界将会受其影响而偏离正确的位置。针对这一问题,本文从特征选择和分类器构建两大角度出发,分别提出了基于间隔的鲁棒的特征选择方法和支持向量机训练算法以及多分类器集成学习方法,提高了KNN(KNearestNeighbor)和支持向量机分类的鲁棒性,具体的研究工作如下:(1)在传统大间隔近邻特征选择中,包含异类噪声点的目标邻域需要分类间隔来指导其邻域的距离学习,但该分类间隔是通过最近邻规则得到的;当目标邻域中存在多个噪声点时,分类间隔鲁棒性差。针对上述问题,本文提出了一种基于鲁棒的间隔统计量的特征选择方法。该方法首先寻找包含异类噪声点的目标邻域,然后计算目标邻域中心点到所有同类和异类样本的距离,采用分类间隔中位数作为优化目标,指导特征权学习,提高了近邻分类的鲁棒性。(2)目前基于分类间隔损失的特征选择方法在处理大噪声样本时,惩罚误分样本的分类损失函数值非常大,导致优化模型的解随噪声产生较大的扰动,降低了算法的鲁棒性。针对上述问题,本文引入了一种鲁棒的损失函数(Brownboost损失)来建立优化目标。由于Brownboost损失具有非凸性,因此将优化目标与正则化技术相结合提出了基于梯度下降的特征权学习算法,提高了支持向量机的抗噪能力。(3)由于现有鲁棒的支持向量机训练算法中鲁棒的损失函数(斜坡损失)存在非凸性,导致其训练时间复杂度较高且分类鲁棒性需进一步改善的问题,本文提出了一种基于光滑截断损失的鲁棒的支持向量机训练方法。该方法首先对斜坡损失进行光滑近似并将其转化为一个光滑的凸函数与一个光滑的凹函数之和的形式,然后采用CCCP(Concave-ConvexProcedure)来求解这一问题,最后利用牛顿梯度下降法来实现其快速的学习,增强了原有算法的分类鲁棒性并提高了其训练速度。(4)由于故障诊断数据中特征维度较高、样本数量较多、类别不平衡并普遍包含噪声的特点,单一的分类学习方法无法满足其抗噪性能的需求,本文提出了一种基于间隔的鲁棒的分类集成学习模型。该模型将训练阶段的集成学习任务分成了四个阶段:随机采样阶段、特征选择阶段、基分类器学习阶段和加权投票阶段。在集成学习的不同阶段融合不同抗噪技术。在分类融合时采用平方损失和L1正则化技术来学习稀疏的基分类器的权值,用其来指导测试阶段的分类预测结果,提高了预期分类的鲁棒性。
摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第14-30页 |
1.1 课题背景及研究意义 | 第14-15页 |
1.1.1 课题来源 | 第14页 |
1.1.2 课题目的及研究意义 | 第14-15页 |
1.2 大间隔分类学习方法的研究现状 | 第15-21页 |
1.2.1 基于间隔的特征选择研究现状 | 第15-18页 |
1.2.2 基于间隔的分类学习方法研究现状 | 第18-20页 |
1.2.3 基于间隔的集成学习研究现状 | 第20-21页 |
1.3 噪声的类型和噪声检测方法的研究现状 | 第21-26页 |
1.3.1 噪声的类型和特性 | 第21-24页 |
1.3.2 噪声检测方法研究现状 | 第24-26页 |
1.4 抗噪学习模型的研究现状 | 第26-27页 |
1.5 论文的主要研究内容与结构安排 | 第27-30页 |
第2章 基于鲁棒的间隔统计量的特征选择方法 | 第30-48页 |
2.1 引言 | 第30页 |
2.2 假设间隔及其泛化界 | 第30-31页 |
2.3 基于间隔的近邻特征权学习算法 | 第31-33页 |
2.4 鲁棒的间隔统计量与特征权学习 | 第33-39页 |
2.4.1 特征评估准则 | 第34-36页 |
2.4.2 特征评估准则分析 | 第36-37页 |
2.4.3 特征权学习和算法 | 第37-39页 |
2.5 实验和分析 | 第39-47页 |
2.5.1 实验设置 | 第39-40页 |
2.5.2 实验结果 | 第40-46页 |
2.5.3 实验结论 | 第46-47页 |
2.6 本章小结 | 第47-48页 |
第3章 基于鲁棒的间隔损失的特征选择方法 | 第48-67页 |
3.1 引言 | 第48页 |
3.2 相关研究 | 第48-52页 |
3.2.1 LASSO系列算法 | 第48-49页 |
3.2.2 SVM-RFE系列算法 | 第49-52页 |
3.3 鲁棒的损失函数和特征权值学习 | 第52-59页 |
3.3.1 鲁棒的损失函数 | 第52-54页 |
3.3.2 基于鲁棒的间隔损失的特征权值学习 | 第54-59页 |
3.4 实验分析 | 第59-65页 |
3.4.1 实验方法和参数设置 | 第59-60页 |
3.4.2 实验结果分析 | 第60-64页 |
3.4.3 实验结论 | 第64-65页 |
3.5 本章小结 | 第65-67页 |
第4章 基于光滑截断损失的鲁棒的支持向量机分类 | 第67-85页 |
4.1 引言 | 第67页 |
4.2 相关研究 | 第67-73页 |
4.2.1 硬间隔SVM分类模型 | 第67-69页 |
4.2.2 软间隔SVM分类模型 | 第69-71页 |
4.2.3 鲁棒的SVM分类模型 | 第71-73页 |
4.3 基于光滑截断损失的鲁棒的SVM学习 | 第73-79页 |
4.3.1 光滑截断损失函数 | 第73-74页 |
4.3.2 凹凸包过程 | 第74-76页 |
4.3.3 牛顿优化过程 | 第76-79页 |
4.4 实验分析 | 第79-84页 |
4.5 本章小结 | 第84-85页 |
第5章 基于间隔的鲁棒的分类集成学习及其应用 | 第85-100页 |
5.1 引言 | 第85页 |
5.2 分类集成学习模型 | 第85-91页 |
5.2.1 差异性基分类器的构建方法 | 第87-89页 |
5.2.2 基模型的融合方法 | 第89-91页 |
5.3 基于间隔分布的基分类器权学习 | 第91-93页 |
5.4 鲁棒的分类集成模型 | 第93-95页 |
5.5 实验分析 | 第95-99页 |
5.5.1 燃气轮机燃烧系统故障数据描述 | 第95-97页 |
5.5.2 实验结果分析 | 第97-99页 |
5.6 本章小结 | 第99-100页 |
结论 | 第100-102页 |
参考文献 | 第102-113页 |
攻读博士学位期间发表的论文及其他成果 | 第113-115页 |
致谢 | 第115-116页 |
个人简历 | 第116页 |
论文购买
论文编号
ABS4008642,这篇论文共116页
会员购买按0.30元/页下载,共需支付
34.8。
不是会员,
注册会员!
会员更优惠
充值送钱!
直接购买按0.5元/页下载,共需要支付
58。
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文