RoboCup仿真2D中的Agent智能决策系统

智能决策系统论文 机器学习论文 多智能体协作论文 R0boCup论文
论文详情
最近几十年,随着计算机技术的迅猛发展,对于分布式多智能体系统(MAS: Multi-agent System)的研究和应用已经成为以人工智能为主的众多相关学科的研究重点。RoboCup即机器人足球世界杯,通常被认为是研究多智能体系统的一项非常有影响力的人工智能方面的重大赛事。RoboCup分为两个大类的项目,分别是仿真和实体机器人。本论文主要是基于仿真项目的比赛赛事,对RoboCup仿真2D比赛当中单个智能体在场上的对于种种因素的各种决策以及多个智能体在对抗的实时环境之中的团队配合决策做了一个重点的研究。在RoboCup仿真比赛之中,智能体的决策大致可以分为高层决策和低层决策。高层决策主要是为了多智能体之间的团队配合服务的,分为战略层决策和战术层决策。高层决策是面向多智能体系统的,具体到单个智能体之上就表现为它的行为决策,在RoboCup之中也叫动作决策。智能体的动作决策就是指智能体(Agent)根据当前场上各种环境状态(包括实际感知和预测),以及赛前己方球队已经制定的合作协议,来决定当前环境下应该发送给服务器的动作指令,同时更新自身的状态。低层决策一般是指智能体高级动作的行为分析之中对于某些因素的决策,例如传球动作当中的对于接球队员的选择决策,射门动作当中的对于射门点选择的决策等。对于RoboCup之中Agent的决策系统,可以将机器学习的方法引入这个优秀的实验平台,帮助Agent在实时比赛的时候无论对于防守还是进攻都能做出更加合理有效的决策。在实际的RoboCup仿真2D球队的开发当中,各支球队的设计和开发人员对于机器学习的引进都不尽相同,但是大部分是以决策树学习,人工神经网络学习和强化学习为主。本论文将机器学习引入到智能体高级动作的学习之中,使智能体高级动作的执行效果进一步优化,成功率进一步提高,从而能够很好的服务于智能体的高层决策。通过将决策树学习算法应用到智能体的传球训练之中,使得智能体的传球更加精准;以及将人工神经网络应用到智能体的射门动作训练中,使得智能体射门的成功率大大提高。最后本论文还将Q学习应用到RoboCup仿真2D比赛的智能体前场进攻动作决策之中,通过引入区域划分,基于区域划分的奖惩函数和对现实生活中真人足球赛中动作决策的模拟,在经过大量周期的学习训练后,使智能体能够进行自主动作决策,从而加强多智能体的前场进攻实力,进而提高整个球队的进攻能力。
摘要第3-5页
Abstract第5-6页
第一章 绪论第9-16页
    1.1 RoboCup概述第9-12页
        1.1.1 RoboCup简介第9页
        1.1.2 RoboCup的比赛赛事第9-10页
        1.1.3 RoboCup的研究重点第10-12页
        1.1.4 RoboCup的研究现状第12页
    1.2 多智能体系统概述第12-16页
        1.2.1 智能Agent第12-14页
        1.2.2 多Agent系统第14-16页
第二章 RoboCup仿真2D介绍第16-24页
    2.1 RoboCup仿真2D环境第16页
    2.2 仿真平台介绍第16-19页
    2.3 仿真模型第19-24页
        2.3.1 运动模型第19-20页
        2.3.2 动作模型第20-22页
        2.3.3 感知模型第22-24页
第三章 RoboCup中的机器学习第24-33页
    3.1 决策树学习第24-25页
    3.2 人工神经网络第25-30页
        3.2.1 人工神经网络概述第25-26页
        3.2.2 BP神经网络第26-30页
    3.3 强化学习第30-33页
        3.3.1 强化学习概述第30-31页
        3.3.2 Q学习算法第31-33页
第四章 Agent高级动作的行为分析第33-36页
    4.1 传球第33-34页
    4.2 射门第34-36页
第五章 Agent的智能决策系统第36-47页
    5.1 智能决策概述第36-37页
    5.2 阵型与跑位第37-38页
    5.3 Agent的动作决策第38-41页
    5.4 进攻与防守第41-43页
    5.5 团队合作第43-47页
第六章 基于Q学习的Agent前场局部进攻训练第47-51页
    6.1 状态描述第47页
    6.2 动作集的确定第47页
    6.3 奖惩回报的确定第47-49页
    6.4 Q值的更新第49页
    6.5 实验结果第49-51页
第七章 总结与展望第51-53页
    7.1 总结第51页
    7.2 展望第51-53页
参考文献第53-56页
攻读硕士期间发表的论文第56-57页
致谢第57页
论文购买
论文编号ABS537757,这篇论文共57页
会员购买按0.30元/页下载,共需支付17.1
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付28.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656