计算机与通信学院知识库

Institutional Repository of Coll Comp & Commun

图片搜索

粘贴图片网址

IR > 计算机与通信学院

	基于自注意力机制的深度强化学习交通信号控制
	张玺君; 聂生元; 李喆; 张红
	2024-02-01
发表期刊	交通运输系统工程与信息
ISSN	1009-6744
页码	1-11
摘要	交通信号控制(Traffic signal control，TSC)仍然是交通领域中最重要的研究课题之一。针对现有基于深度强化学习(Deep Reinforcement Learning，DRL)的交通信号控制方法的状态需要人为设计，导致提取交通状态信息难度大以及交通状态信息无法全面表达的问题，为了从有限特征中挖掘潜在交通状态信息，从而降低交通状态设计难度，提出一种引入自注意力网络的DRL算法(GC＿PPO)。首先，仅获取交叉口各进入口车道车辆位置，使用非均匀量化和独热编码方法预处理得到车辆位置分布矩阵；其次，使用自注意力网络挖掘车辆位置分布矩阵的空间相关性和潜在信息，作为DRL算法的输入；最后，在单交叉口学习交通信号自适应控制策略，在多交叉口路网中验证所提算法的适应性和鲁棒性。仿真结果表明，在单交叉口环境下，与三种基准算法相比，所提算法在车辆平均等待时间等指标上具有更好的性能；在多交叉口路网中，所提算法仍然具有良好的适应性。
关键词	智能交通自适应控制深度强化学习自注意力网络近端策略优化
URL	查看原文
收录类别	北大核心 ; CSCD
语种	中文
资助项目	国家自然科学基金（62162040）;甘肃省自然科学基金重点项目(22JR5RA226);甘肃省高等学校创新基金项目(2021A-028)
中图分类号	U491.54
原始文献类型	学术期刊
引用统计
文献类型	期刊论文
条目标识符	https://ir.lut.edu.cn/handle/2XXMBERH/169371
专题	计算机与通信学院
通讯作者	张玺君
作者单位	兰州理工大学计算机与通信学院
第一作者单位	计算机与通信学院
通讯作者单位	计算机与通信学院
第一作者的第一单位	计算机与通信学院
推荐引用方式 GB/T 7714	张玺君,聂生元,李喆,等. 基于自注意力机制的深度强化学习交通信号控制[J]. 交通运输系统工程与信息,2024:1-11.
APA	张玺君,聂生元,李喆,&张红.(2024).基于自注意力机制的深度强化学习交通信号控制.交通运输系统工程与信息,1-11.
MLA	张玺君,et al."基于自注意力机制的深度强化学习交通信号控制".交通运输系统工程与信息 (2024):1-11.

条目包含的文件
条目无相关文件。

个性服务

查看访问统计

谷歌学术

谷歌学术中相似的文章

[张玺君]的文章

[聂生元]的文章

[李喆]的文章

百度学术

百度学术中相似的文章

[张玺君]的文章

[聂生元]的文章

[李喆]的文章

必应学术

必应学术中相似的文章

[张玺君]的文章

[聂生元]的文章

[李喆]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量82952
全文量27055
访问量7109408
下载量871650