基于Agent的分布式元搜索引擎架构研究与实现

元搜索论文 Web数据抽取论文 Web-Harvest论文 智能Agent论文 信息采集论文
论文详情
现有的搜索引擎在查全率和查准率方面很难满足用户的要求,为了查询到一个相关的内容,用户常常需要使用多个搜索引擎查询相同的内容,然后综合出最适合自己的结果。元搜索引擎通过调用多个成员搜索引擎来进行搜索,因此可以很好地解决上述问题。Web数据提取技术是元搜索引擎的核心,如何准确、高效地从Web页面中提取内容对于一个元搜索引擎来说至关重要。作者对开源的Web数据提取工具Web-Harvest进行了深入的研究,并在此基础上进行了二次开发,摒弃了以前的通过写配置文件(页面抽取规则)进行页面抽取的方式,改用API的方式重新封装了Web-Harvest的几个关键部分。这种方式不但提高了程序提取页面数据的效率,同时提高了程序开发人员的开发效率。智能Agent是人工智能领域发展起来的一个概念,它所特有的自主性、社会性、反应性和能动性可以大大提高系统的灵活性和智能性。作者将Agent技术应用于所构建的信息采集系统,通过实践证明,可以将整个信息采集任务分散到各个Agent上并发运行,这样可以极大提高信息采集的效率。元搜索引擎可以帮助用户整合来自不同搜索引擎的搜索结果,最关键的是重新给出相关度,按新的相关性排列查询结果后提交给用户。作者将Agent技术、Web技术和Web数据提取技术结合,构建了基于MAS的元搜索引擎。通过实验显示,系统在查全率方面有所提高,同时,重新给出了搜索结果的相关度,大大提升了用户的体验。在系统架构方面,这种方式极大地提高了整个系统架构的灵活性和可扩展性,为构建更加复杂、更加智能的系统提供了一种新的模式。
摘要第5-6页
ABSTRACT第6-7页
目录第8-9页
第一章 绪论第9-14页
    1.1 课题研究背景及意义第9-10页
    1.2 国内外研究现状及分析第10-12页
    1.3 本文工作及论文结构第12-13页
    1.4 小结第13-14页
第二章 元搜索引擎介绍第14-18页
    2.1 什么是元搜索引擎第14页
    2.2 元搜索引擎的体系结构第14-15页
    2.3 元搜索引擎的特点第15-16页
    2.4 元搜索引擎的研究热点第16页
    2.5 元搜索引擎的发展趋势第16-17页
    2.6 小结第17-18页
第三章 Web数据提取第18-33页
    3.1 Web数据提取的流程与方法第18-25页
    3.2 Web-Harvest第25-28页
    3.3 对Web-Harvest的二次开发第28-32页
    3.4 小结第32-33页
第四章 智能Agent第33-42页
    4.1 Agent技术第33-36页
    4.2 开源框架JADE第36-39页
    4.3 基于MAS的信息采集系统第39-41页
    4.4 小结第41-42页
第五章 基于MAS的元搜索引擎设计与实现第42-51页
    5.1 系统分析第42页
    5.2 系统结构第42-44页
    5.3 系统功能实现第44-50页
    5.4 系统效果分析第50页
    5.5 小结第50-51页
第六章 总结及展望第51-53页
    6.1 总结第51-52页
    6.2 展望第52-53页
参考文献第53-55页
致谢第55-56页
攻读硕士学位期间发表的学术论文目录第56-57页
读研期间参与的科研项目情况第57页
论文购买
论文编号ABS558481,这篇论文共57页
会员购买按0.30元/页下载,共需支付17.1
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付28.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656