基于关联规则的数据挖掘方法研究--加权关联规则挖掘的研究

数据挖掘论文 关联规则论文 加权关联规则论文 频繁项集论文
论文详情
数据挖掘是人工智能和数据库技术等领域的研究热点,正在现实应用中发挥着强大的作用。关联规则挖掘是数据挖掘中一个最活跃、最重要的研究课题,主要目的是从给定的数据集中发现项目之间有趣的关联和相关关系。传统关联规则挖掘算法认为数据集中每个项目和交易记录具有相同的重要性,而实际上,用户往往对每个项目和记录的重要性加以区分,以便发现更感兴趣和更有价值的规则。加权关联规则挖掘解决了上述问题,并正受到越来越多的国内外研究者的重视。本文概述了数据挖掘和关联规则的相关知识,并系统地介绍了垂直、水平、混合加权关联规则挖掘,讨论和分析了常见加权关联规则挖掘算法模型。在对加权关联规则进行了深入研究的同时,提出了相关改进算法和应用。首先,说明了New_Aprior的缺陷,详细地分析了其改进算法—MWFI(Mining Weighted Frequent Itemsets)算法的不足,根据项目的不同重要性,提出了一种改进的加权关联规则挖掘算法。改进算法通过按属性的权值对事务进行分类,使挖掘每个类别内频繁项集的过程满足Apriori性质,可以利用Apriori算法或其它改进算法进行挖掘,提高了挖掘加权关联规则的效率,并且很容易扩展到混合加权关联规则挖掘中。另外,数据库中的项目分布往往是不均匀的,需要为项目设置不同的最小支持度。本文在考虑了记录的不同重要性的同时允许为不同项目设置不同的支持度,给出了一种多最小支持度加权关联规则挖掘算法。该算法挖掘频繁项集的过程克服了多最小支持度情况下不满足Apriori性质的缺陷,且不需多次重复扫描数据库,剔除了冗余项目并对相同项集累加计数,实验证明了算法的效率。最后,将加权关联规则应用到时态数据库挖掘中,提出了一种加权时态关联规则的挖掘方法。算法给出了有效的剪枝方法,克服了现有以项目生命周期为时间特征的关联规则算法中直接用频繁(k-1)-项集连接生成候选k-项集的不合理之处,并通过实例分析和实验对比验证了算法的有效性。挖掘出的规则既突出了项目的权重,又体现了现实数据中的时态语义,更具有实际应用价值。
摘要第3-4页
Abstract第4页
第一章 绪论第7-11页
    1.1 研究背景第7页
    1.2 国内外研究现状第7-9页
    1.3 研究的目的和意义第9页
    1.4 论文的创新点及组织结构第9-10页
    1.5 本章小结第10-11页
第二章 数据挖掘及关联规则第11-20页
    2.1 引言第11页
    2.2 数据挖掘第11-14页
        2.2.1 数据挖掘的概念第11页
        2.2.2 数据挖掘的任务和功能第11-12页
        2.2.3 数据挖掘的过程第12-13页
        2.2.4 数据挖掘技术的应用第13页
        2.2.5 数据挖掘面临的主要问题第13-14页
    2.3 关联规则概述第14-17页
        2.3.1 关联规则的基本概念第14-15页
        2.3.2 关联规则分类第15页
        2.3.3 关联规则挖掘的步骤第15-16页
        2.3.4 关联规则的扩展研究第16-17页
    2.4 经典Apriori 算法第17-19页
        2.4.1 Apriori 算法描述第17-18页
        2.4.2 Apriori 算法分析及优化第18-19页
    2.5 本章小结第19-20页
第三章 加权关联规则的挖掘第20-30页
    3.1 引言第20页
    3.2 垂直加权关联规则第20-22页
        3.2.1 垂直加权关联规则的提出第20-21页
        3.2.2 垂直加权关联规则的定义及实例分析第21-22页
    3.3 水平加权关联规则第22-28页
        3.3.1 水平加权关联规则的提出第22-23页
        3.3.2 MINWAL(O)和MINWAL(W)算法模型第23-25页
        3.3.3 权重归一化思想算法模型第25-26页
        3.3.4 New_Apriori 算法模型第26-28页
    3.4 混合加权关联规则第28-29页
    3.5 加权关联规则权值的设置第29页
    3.6 本章小结第29-30页
第四章 加权关联规则挖掘算法的研究改进第30-45页
    4.1 引言第30页
    4.2 一种挖掘加权关联规则的改进算法第30-37页
        4.2.1 问题的提出第30-31页
        4.2.2 New_Apriori 和MWFI 算法分析第31-32页
        4.2.3 改进算法New-MWFI第32-35页
        4.2.4 实验结果与分析第35-37页
        4.2.5 算法的扩展性第37页
    4.3 一种多最小支持度的加权关联规则挖掘算法第37-44页
        4.3.1 问题的提出第37-38页
        4.3.2 相关定义及定理第38-39页
        4.3.3 改进算法第39-42页
        4.3.4 实验结果与分析第42-44页
    4.4 本章小结第44-45页
第五章 加权关联规则在时态数据库挖掘中的应用研究第45-55页
    5.1 引言第45页
    5.2 时态数据库中时态型的定义第45-46页
    5.3 时态数据库中关联规则的挖掘第46-48页
        5.3.1 时态关联规则的相关研究工作第46页
        5.3.2 时态关联规则的相关定义第46页
        5.3.3 时态关联规则的挖掘算法第46-48页
    5.4 时态数据库中加权关联规则的挖掘第48-54页
        5.4.1 问题的提出第48-49页
        5.4.2 相关定义及定理第49-50页
        5.4.3 加权时态关联规则算法描述第50-51页
        5.4.4 实例说明第51-52页
        5.4.5 实验对比分析第52-54页
    5.5 本章小结第54-55页
第六章 总结与展望第55-56页
致谢第56-57页
参考文献第57-62页
附录:作者在攻读硕士学位期间发表的论文第62页
论文购买
论文编号ABS715339,这篇论文共62页
会员购买按0.30元/页下载,共需支付18.6
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付31
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656