高校舆情捕获分析系统的研究与实现

网络舆情论文 高校论坛论文
论文详情
随着网络技术的迅速发展和普及,人们的生活工作越来越依赖于互联网,而互联网也逐步成为人们获取信息交流信息的一个主要平台,由于网络信息传递的便捷与自由的特点,正面的和负面的信息在互联网上的传播都非常的迅速,同时网络的信息成为能够很好的反应社会当下舆情的一个主要媒介,这些负面的舆情要是不加以适当控制可能会对社会带来巨大的影响,同时一些正面的舆情信息的获取能够为政府机构等作出正确的决策提供辅助作用。而作为一个网络覆盖率高达90%以上的高校来说网络舆情在网络环境中的作用尤为明显,复杂的网络环境不仅可以给学校的教育以及日常管理带来极大好处,同时也为一些负面信息的传播提供很好的平台,所以对高校网络舆情监控就变得十分紧迫而且重要。而论坛作为学校最活跃的网络平台也就成为了舆情传播最主要的途径。所以本文针对高校论坛舆情信息的捕获与分析做重点研究。鉴于网络舆情的海量特点,再用人工手段收集以及分析的成本变的很高而且效率不高。在此提出高校论坛舆情捕获分析系统的实现与研究。该系统能为高校管理提供很好的决策辅助作用。综合高校论坛的特性,本文主要针对以下几个关键问题展开讨论和研发:多线程聚焦网络爬虫,高效率中文分词,文本倾向性分析。首先对Web页面收集技术即网络爬虫进行了研究,并将其原理与高校论坛特性充分结合,提出了一个定向于校园BBS的舆情数据收集与提取系统。并采用针对论坛的聚焦型网络爬虫,加入多线程技术,大大提高网络爬虫的工作效率。在中文分词方面是在使用盘古分词方法的基础上做出适当修改,加入关注词高亮显示功能。该方法在分词之前,会把三个词典提前加载到内存的Dictionary中,并且使用哈希函数来加快Dictionary的读取效率,因而分词效率很高。在现有汉语倾向性分析的研究基础上,本文提出了针对BBS主题帖及跟帖的倾向性分析方法,通过实验表明,本研究初步达到设计要求。
摘要第3-4页
Abstract第4-5页
第一章 绪论第9-12页
    1.1 课题研究背景第9-10页
    1.2 国内外研究现状第10-11页
        1.2.1 国内研究现状第10页
        1.2.2 国外研究现状第10-11页
    1.3 研究内容与论文组织第11-12页
第二章 核心技术研究第12-26页
    2.1 网络爬虫技术研究第12-17页
        2.1.1 定义采集目标第12-13页
        2.1.2 制定过滤规则第13-16页
        2.1.3 URL搜索策略第16页
        2.1.4 多线程优化第16-17页
    2.2 文本预处理第17-18页
    2.3 语义网络研究及实验第18-24页
        2.3.1 语义网络的结构与搭建流程第18-21页
            2.3.1.1 语义网络搭建流程分析第19-20页
            2.3.1.2 语义规则搭建流程分析第20-21页
        2.3.2 语义网络的匹配流程第21页
        2.3.3 语义规则的提取模拟实验第21-24页
    2.4 Web Service技术第24-25页
    2.5 本章小结第25-26页
第三章 系统需求分析第26-33页
    3.1 系统基本要求第26页
    3.2 系统需求分析第26-29页
        3.2.1 系统流程分析第26-29页
        3.2.2 性能需求第29页
    3.3 系统用例分析第29-32页
    3.4 本章小结第32-33页
第四章 系统设计第33-41页
    4.1 系统主要模块的设计第33-34页
    4.2 系统架构设计第34-35页
    4.3 数据库设计第35-40页
    4.4 本章小结第40-41页
第五章 系统实现第41-70页
    5.1 系统开发环境第41-43页
        5.1.1 硬件于软件环境第41页
        5.1.2 开发工具与插件第41-43页
    5.2 数据采集端实现第43-50页
        5.2.1 过滤器实现第43-44页
        5.2.2 页面路由实现第44-46页
        5.2.3 网络爬虫的实现第46-50页
    5.3 网络舆情分析端的实现第50-54页
        5.3.1 文本预处理第50-51页
        5.3.2 领域词汇组织第51-52页
        5.3.3 语义规则的创建第52-54页
        5.3.4 文本与规则的匹配第54页
    5.4 舆情服务端实现第54-55页
    5.5 主要界面展示第55-69页
        5.5.1 舆情信息展示页面的实现第55-56页
        5.5.2 近期热点模块的实现第56-57页
        5.5.3 舆情发现模块的实现第57-58页
        5.5.4 热点走势模块的实现第58-59页
        5.5.5 舆情简报模块的实现第59-61页
        5.5.6 后台登陆模块实现第61-62页
        5.5.7 管理员管理模块实现第62页
        5.5.8 舆情发布管理模块实现第62-64页
        5.5.9 舆情发布管理模块实现第64-65页
        5.5.10 数据库管理模块实现第65-66页
        5.5.11 舆情分析后台管理模块实现第66-69页
    5.6 本章小结第69-70页
第六章 总结与展望第70-72页
参考文献第72-74页
论文购买
论文编号ABS3966772,这篇论文共74页
会员购买按0.30元/页下载,共需支付22.2
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付37
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656