Lanzhou University of Technology Institutional Repository (LUT_IR)
改进的CE-Q 算法用于多Agent 觅食的研究 | |
雷默涵; 杨萍 | |
2015 | |
发表期刊 | 机械设计 |
ISSN | 1001-2354 |
卷号 | 32期号:6页码:1-4 |
摘要 | 针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。 |
关键词 | CE-Q 强化学习算法 动作过程奖赏 多Agent 觅食任务 系统效率 |
收录类别 | CSCD |
语种 | 中文 |
WOS研究方向 | Engineering |
WOS类目 | ENGINEERING MECHANICAL |
CSCD记录号 | CSCD:5460684 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | https://ir.lut.edu.cn/handle/2XXMBERH/70801 |
专题 | 高等教育研究所(教学质量监督与评估工作办公室、本科教学督导委员会研究生督导委员会) |
作者单位 | 兰州理工大学机电工程学院, 兰州, 甘肃 730050, 中国 |
第一作者单位 | 机电工程学院 |
第一作者的第一单位 | 机电工程学院 |
推荐引用方式 GB/T 7714 | 雷默涵,杨萍. 改进的CE-Q 算法用于多Agent 觅食的研究[J]. 机械设计,2015,32(6):1-4. |
APA | 雷默涵,&杨萍.(2015).改进的CE-Q 算法用于多Agent 觅食的研究.机械设计,32(6),1-4. |
MLA | 雷默涵,et al."改进的CE-Q 算法用于多Agent 觅食的研究".机械设计 32.6(2015):1-4. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
改进的CE-Q算法用于多Agent觅食的(443KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[雷默涵]的文章 |
[杨萍]的文章 |
百度学术 |
百度学术中相似的文章 |
[雷默涵]的文章 |
[杨萍]的文章 |
必应学术 |
必应学术中相似的文章 |
[雷默涵]的文章 |
[杨萍]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论