微博网络中的重叠社区发现算法研究

复杂网络论文 微博网络论文 重叠社区发现论文 加权策略论文 多种群遗传算法论文
论文详情
随着互联网和移动通信技术的快速发展,越来越多的用户开始使用社交系统进行信息交换和共享,形成了越来越庞大的社交网络。这种形成于物理网络之上的逻辑网络反映了人们的偏好和社会关系,如何发现社交网络的特征和潜在价值已成为研究者们广泛关注的问题。作为网络(特别是社交网络)研究的内容之一社区发现对于研究网络内部的结构特征有着十分重要的意义。本文以微博网络为对象,研究具有重叠结构的网络,并提出了一种重叠社区发现算法。论文的主要工作包括以下几个方面:· 从三个方面入手,研究了社区发现方法的发展与现状:从复杂网络理论的角度出发,分析讨论了传统的复杂网络框架下的社区发现算法的原理、特点和优劣;分析归纳了微博网络的特性,并总结了利用该类特性进行传统社区发现算法改进的各类算法和方案;概括总结了复杂网络中利用遗传算法进行社区发现的关键技术。· 提出了一种基于遗传算法的重叠社区发现算法(Overlapping Community Detection based on GA for Weighting Weibo Network, WOGA)。WOGA算法主要分两大部分:微博网络的加权算法(Weibo Network Weighting Method,WNWM);基于遗传算法的重叠社区发现(Overlapping Community Detection based on GA, OCDGA)。WNWM综合考虑微博用户间显性关系、交互频率、主题兴趣相似度、用户标签相似度等因素,建立了一个用户关系强度评价模型,进而对微博网络中用户间的连接边进行加权。OCDGA通过改进自适应迁移策略的多种群遗传算法原有的矩阵编码方案,对个体进行编码;利用加权网络改进重叠模块度函数,用作个体适应度函数;建立了基于节点中心性原则和节点相似度原则的种群初始化方案;构建了基于重叠社区和矩阵编码方式的交叉和变异运算,并设计了部分精英保留策略的选择算法。此外,OCDGA还引入了自适应种群迁移策略以保证算法执行效率的同时提高其准确度。·给出了基于MapReduce的WNWM算法和OCDGA算法的分布式实现方案。在OCDGA算法的分布式实现过程中,提出使用粗粒度-粗粒度的层次PGA (Parallel Genetic Algorithms,并行遗传算法)模型来设计种群间的迁移规则。本文分别在人工网络、经典的真实网络和微博网络三种类型的网络上测试了WOGA算法的实验结果,并与传统的社区发现算法进行比较。实验结果证明了本文提出的算法具有较高的准确度,特别是在微博网络的用户交互行为和网络结构的分析中,WOGA算法有较好的效果。
致谢第5-6页
摘要第6-8页
ABSTRACT第8-9页
1 绪论第13-19页
    1.1 研究背景与意义第13-15页
    1.2 论文研究内容第15-16页
    1.3 论文结构安排第16-19页
2 复杂网络与社区发现第19-33页
    2.1 引言第19页
    2.2 复杂网络第19-22页
        2.2.1 复杂网络的概念与表示方法第19-20页
        2.2.2 复杂网络的特征度量第20-21页
        2.2.3 复杂网络的特性第21-22页
    2.3 社区发现第22-25页
        2.3.1 复杂网络的社区结构第22-23页
        2.3.2 社区结构评价函数第23-24页
        2.3.3 复杂网络的社区发现算法第24-25页
    2.4 微博网络的社区发现第25-29页
        2.4.1 基于微博主题的社区发现第25-26页
        2.4.2 基于用户属性的社区发现第26-27页
        2.4.3 基于交互行为的社区发现第27-29页
    2.5 遗传算法第29-32页
        2.5.1 遗传算法原理第29-30页
        2.5.2 遗传算法在社区发现中的应用第30-32页
    2.6 本章小结第32-33页
3 微博网络的用户关系评估第33-43页
    3.1 引言第33页
    3.2 基于用户显性关系的静态拓扑结构第33-34页
    3.3 基于交互信息的用户关系评价第34-36页
    3.4 基于主题兴趣的用户关系评价第36-39页
        3.4.1 中文分词与特征词提取第36-37页
        3.4.2 基于微博的用户关系评价第37-38页
        3.4.3 基于标签的用户关系评价第38-39页
    3.5 微博用户关系强度评估模型第39-41页
    3.6 本章小结第41-43页
4 基于遗传算法的重叠社区发现第43-57页
    4.1 引言第43页
    4.2 编码方式与个体适应度函数第43-45页
    4.3 种群初始化第45-49页
        4.3.1 社区中心节点的生成第46-47页
        4.3.2 初始社区的生成第47-49页
    4.4 交叉算子第49-51页
    4.5 变异算子第51-52页
    4.6 选择算子第52-53页
    4.7 种群迁移策略第53-55页
    4.8 算法整体描述第55-56页
    4.9 本章小结第56-57页
5 大数据环境下算法的分布式实现第57-71页
    5.1 引言第57页
    5.2 HADOOP分布式计算框架第57-60页
        5.2.1 MapReduce分布式计算模型第57-59页
        5.2.2 Hadoop分布式运行环境第59-60页
    5.3 微博网络加权策略的分布式实现第60-63页
    5.4 多种群遗传算法的分布式实现第63-69页
        5.4.1 并行遗传算法第63-65页
        5.4.2 OCDGA算法的分布式实现第65-69页
    5.5 本章小结第69-71页
6 实验结果与分析第71-81页
    6.1 引言第71-72页
    6.2 人工网络结果分析第72-73页
    6.3 经典真实网络结果分析第73-75页
    6.4 微博网络结果与分析第75-80页
        6.4.1 微博网络数据的采集第75-76页
        6.4.2 社区发现结果与分析第76-80页
    6.5 本章小结第80-81页
7 总结与展望第81-83页
    7.1 总结第81-82页
    7.2 展望第82-83页
参考文献第83-87页
作者简历及攻读硕士学位期间取得的研究成果第87-91页
学位论文数据集第91页
论文购买
论文编号ABS3597288,这篇论文共91页
会员购买按0.30元/页下载,共需支付27.3
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付45.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656