基于连接度量的社区发现研究

连接论文 社区发现论文 模块度论文 交互度论文 可视化论文
论文详情
近年来,在不同领域、广泛多样的系统中,图变成了一种极其有用的描述工具,生物,社会,技术和信息网络等许多领域的系统都能建模为图(网络)来研究。为了理解网络系统的特征,网络分析研究就变得非常重要。对网络的研究从最初的规则网络,到随机网络,到近几年的复杂网络,越来越多关于网络的研究工作持续开展。无标度网络的发现,使人类对于复杂网络系统有了全新的认识。在这样的网络中,顶点度的分布显示出很大的不均匀性,同时,表现出高水平的秩序和组织,特点是网络中顶点度的分布非常广泛,大量低度数的顶点围绕少量高度数的顶点共存,网络呈现出社区结构(也称为簇或模块)。社区发现在社会学、生物学和计算机科学等学科中都有重要应用,如提高网络服务质量、增强网络销售、发现有共同兴趣的科学家小组、揭示政府组织运行方式、发现动物的社会组织结构、聚类功能基因等等。近年,关于社区发现的很多新概念和新方法被提出来。在无权图研究方面:模块度的提出极大促进该方向的研究,基于模块度优化的社区发现方法成为了主流方法,但现有模块度定义在一些应用背景下存在不足,有的模块度优化方法也存在缺陷。在带权图研究方面:针对带权图的工作相对来说比较少,权值本身的意义没有获得重视。而且,很多社会网络是基于交互行为建立的,交互的数量对社区结构有重要的影响。鉴于上述问题,为扩展社区发现算法的适应范围、提高发现社区的准确性、合理发现带权图中的社区结构,本文关注连接的度量问题,在模块度定义、改进社区发现算法、带权图社区发现等方面开展了研究工作。本文的主要研究内容和创新之处总结如下:(1)提出了基于耦合度的模块度。针对现有模块度在社区规模差异大和多社区情况下的不足,根据社区内部顶点间的连接相对紧密,社区之间的连接相对稀疏的特点。定义了社区间的连接密度和社区内的连接密度两个数值,通过二者之比定义了社区间祸合度,社区间连接越稀疏,社区内部越紧密,则社区耦合度越小。基于社区耦合度的定义,提出一种新的基于社区耦合程度的模块度,用来度量整个网络中社区划分质量。通过实验证实,该模块度既适用于社区大小相似的情形,也适用于社区大小差异较大的情形,并且在多社区的情况下,有比较合理的度量效果。(2)提出了一个非递归分裂的模块度优化社区发现算法。因递归二分过程的影响,分裂式模块度优化算法在多社区情况下存在划分结果可能不理想的问题。本文依据类似于k-均值聚类的思想,提出了一种基于模块度优化的社区发现算法。该算法根据指定的社区数目对网络进行初始划分,通过迭代移动社区内的顶点,完成网络的自组织,使得算法在当前社区数目已定的条件下,搜索到具有最大模块度的网络划分。随后,增大社区数目,重复上述过程,直至模块度减小或社区数目达到用户指定的最大数目k。算法中,每次对社区数目为n的初始划分都是在原始网络上进行,有效避免了递归二分引起的问题。实验表明,社区发现的效果良好。(3)基于成员交互行为,提出交互度的概念,并应用于层次凝聚社区发现算法。在描述交互关系的社会网络中,直观地认识到,顶点之间交互的强弱主要是包括两个方面:一是交互的绝对数量,二是交互的对等性。据此,提出了顶点交互度的概念,分析了网络拓扑结构对交互度的影响,引入概率中的可靠性概念,把顶点之间的交互度推广到社区之间的交互度。随后,以交互度作为层次凝聚算法的相似度指标,提出了基于交互度的层次凝聚社区发现算法,该算法能够比较自然地模拟社区的形成。实验表明,在带权图中能较好的发现合理的社区结构。(4)开发了一个社区发现的可视化工具软件Snviewer,提出了分层力导引算法。为了直观、高效地观察图和社区发现结果,基于JAVA平台,利用OpenGL图形编程接口,以力导引方法为布点算法,开发了一个可以动态演示图结构和社区发现结果的可视化工具。为了更好地显示社区发现结果,提出了分层力导引算法。另外,在动态布局过程中提供了人机交互机制,可以直观地人工干预布点过程,使布点结果更符合人们的观察习惯。
摘要第3-5页
Abstract第5-7页
目录第8-11页
第1章 前言第11-17页
    1.1 研究背景及意义第11-14页
    1.2 本文研究的内容第14-16页
    1.3 本文的组织第16-17页
第2章 基本概念和方法第17-30页
    2.1 社会网络和社区发现第17-20页
        2.1.1 社会网络第17-18页
        2.1.2 社区和社区发现第18-20页
    2.2 社区发现方法第20-30页
        2.2.1 相似度第20-23页
        2.2.2 模块度第23-25页
        2.2.3 Kernighan-Lin算法第25-26页
        2.2.4 Duch和Arenas的算法第26-27页
        2.2.5 层次聚类算法第27-30页
第3章 基于改进模块度的无权图社区发现第30-56页
    3.1 引言第30-34页
        3.1.1 问题的提出第30-32页
        3.1.2 相关工作第32-33页
        3.1.3 本章研究的基本思想第33-34页
    3.2 基于社区耦合度的模块度第34-37页
    3.3 基于MC模块度的社区发现算法第37-46页
        3.3.1 算法描述第38-40页
        3.3.2 模块度增量计算第40-43页
        3.3.3 单个移动顶点选择第43-45页
        3.3.4 移动点群选择第45-46页
    3.4 实验结果第46-54页
    3.5 小结第54-56页
第4章 基于交互度的带权图社区发现第56-84页
    4.1 引言第56-59页
    4.2 交互度第59-67页
    4.3 基干交互度的层次凝聚算法第67-71页
    4.4 实验结果第71-83页
    4.5 小结第83-84页
第5章 社区发现可视化工具Snviewer第84-98页
    5.1 引言第84-85页
    5.2 算法和相关技术第85-90页
    5.3 功能和效果演示第90-97页
    5.4 小结第97-98页
第6章 结束语第98-100页
参考文献第100-108页
致谢第108-109页
附录第109页
    1 在读期间承担的科研项目第109页
    2 在读期间完成及发表的著作、论文第109页
论文购买
论文编号ABS542573,这篇论文共109页
会员购买按0.30元/页下载,共需支付32.7
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付54.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656