基于自注意力机制的深度强化学习交通信号控制
张玺君; 聂生元; 李喆; 张红
2024-02-01
发表期刊交通运输系统工程与信息
ISSN1009-6744
页码1-11
摘要交通信号控制(Traffic signal control,TSC)仍然是交通领域中最重要的研究课题之一。针对现有基于深度强化学习(Deep Reinforcement Learning,DRL)的交通信号控制方法的状态需要人为设计,导致提取交通状态信息难度大以及交通状态信息无法全面表达的问题,为了从有限特征中挖掘潜在交通状态信息,从而降低交通状态设计难度,提出一种引入自注意力网络的DRL算法(GC_PPO)。首先,仅获取交叉口各进入口车道车辆位置,使用非均匀量化和独热编码方法预处理得到车辆位置分布矩阵;其次,使用自注意力网络挖掘车辆位置分布矩阵的空间相关性和潜在信息,作为DRL算法的输入;最后,在单交叉口学习交通信号自适应控制策略,在多交叉口路网中验证所提算法的适应性和鲁棒性。仿真结果表明,在单交叉口环境下,与三种基准算法相比,所提算法在车辆平均等待时间等指标上具有更好的性能;在多交叉口路网中,所提算法仍然具有良好的适应性。
关键词智能交通 自适应控制 深度强化学习 自注意力网络 近端策略优化
URL查看原文
收录类别北大核心 ; CSCD
语种中文
资助项目国家自然科学基金(62162040);甘肃省自然科学基金重点项目(22JR5RA226);甘肃省高等学校创新基金项目(2021A-028)
中图分类号U491.54
原始文献类型学术期刊
引用统计
文献类型期刊论文
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/169371
专题计算机与通信学院
通讯作者张玺君
作者单位兰州理工大学计算机与通信学院
第一作者单位计算机与通信学院
通讯作者单位计算机与通信学院
第一作者的第一单位计算机与通信学院
推荐引用方式
GB/T 7714
张玺君,聂生元,李喆,等. 基于自注意力机制的深度强化学习交通信号控制[J]. 交通运输系统工程与信息,2024:1-11.
APA 张玺君,聂生元,李喆,&张红.(2024).基于自注意力机制的深度强化学习交通信号控制.交通运输系统工程与信息,1-11.
MLA 张玺君,et al."基于自注意力机制的深度强化学习交通信号控制".交通运输系统工程与信息 (2024):1-11.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[张玺君]的文章
[聂生元]的文章
[李喆]的文章
百度学术
百度学术中相似的文章
[张玺君]的文章
[聂生元]的文章
[李喆]的文章
必应学术
必应学术中相似的文章
[张玺君]的文章
[聂生元]的文章
[李喆]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。