机器人足球赛中基于增强学习的任务分工

发布时间:2010-3-3 14:48    发布者:irobot
关键词: 分工 , 机器人 , 任务 , 学习 , 足球赛
摘要:本文研究了机器人足球赛中利用增强学习进行角色分工的问题,通过仿真试验和理论分析,指出文[1]中采取无限作用范围衰减奖励优化模型(infinite—horizon discounted model)的Q学习算法对该任务不合适,并用平均奖励模型(average—reward model)对算法进行了改进,实验表明改进后学习的收敛速度以及系统的性能都提高了近一倍。

PDF下载: 机器人足球赛中基于增强学习的任务分工.pdf (373.53 KB)
本文地址:https://www.eechina.com/thread-8772-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

相关视频

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表