改进的CE-Q 算法用于多Agent 觅食的研究
雷默涵; 杨萍
2015
发表期刊机械设计
ISSN1001-2354
卷号32期号:6页码:1-4
摘要针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。
关键词CE-Q 强化学习算法 动作过程奖赏 多Agent 觅食任务 系统效率
收录类别CSCD
语种中文
WOS研究方向Engineering
WOS类目ENGINEERING MECHANICAL
CSCD记录号CSCD:5460684
引用统计
文献类型期刊论文
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/70801
专题高等教育研究所(教学质量监督与评估工作办公室、本科教学督导委员会研究生督导委员会)
作者单位兰州理工大学机电工程学院, 兰州, 甘肃 730050, 中国
第一作者单位机电工程学院
第一作者的第一单位机电工程学院
推荐引用方式
GB/T 7714
雷默涵,杨萍. 改进的CE-Q 算法用于多Agent 觅食的研究[J]. 机械设计,2015,32(6):1-4.
APA 雷默涵,&杨萍.(2015).改进的CE-Q 算法用于多Agent 觅食的研究.机械设计,32(6),1-4.
MLA 雷默涵,et al."改进的CE-Q 算法用于多Agent 觅食的研究".机械设计 32.6(2015):1-4.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
改进的CE-Q算法用于多Agent觅食的(443KB)期刊论文出版稿开放获取CC BY-NC-SA浏览 下载
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[雷默涵]的文章
[杨萍]的文章
百度学术
百度学术中相似的文章
[雷默涵]的文章
[杨萍]的文章
必应学术
必应学术中相似的文章
[雷默涵]的文章
[杨萍]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 改进的CE-Q算法用于多Agent觅食的研究.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。