电气工程与信息工程学院知识库

Institutional Repository of Coll Elect & Informat Engn

图片搜索

粘贴图片网址

IR > 电气工程与信息工程学院

	扩展目标跟踪中基于深度强化学习的传感器管理方法
	张虹芸; 陈辉; 张文旭
	2024-06-07
发表期刊	自动化学报
ISSN	0254-4156
摘要	针对扩展目标跟踪(Extended target tracking, ETT)优化中的传感器管理问题,基于随机矩阵模型(Random matrices model, RMM)建模扩展目标,提出一种基于深度强化学习(Deep reinforcement learning, DRL)的传感器管理方法.首先,在部分可观测马尔科夫决策过程(Partially observed Markov decision process, POMDP)理论框架下,给出基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)算法的扩展目标跟踪传感器管理的基本方法;其次,利用高斯瓦瑟斯坦距离(Gaussian Wasserstein distance, GWD)求解扩展目标先验概率密度与后验概率密度之间的信息增益,对扩展目标多特征估计信息进行综合评价,进而以信息增益作为TD3算法奖励函数的构建;然后,通过推导出的奖励函数,进行基于深度强化学习的传感器管理方法的最优决策;最后,通过构造扩展目标跟踪优化仿真实验,验证了所提方法的有效性.
关键词	传感器管理扩展目标跟踪深度强化学习双延迟深度确定性策略梯度信息增益
DOI	10.16383/j.aas.c230591
URL	查看原文
收录类别	北大核心 ; CSCD
语种	中文
资助项目	国家自然科学基金(62163023,62366031,62363023,61873116);甘肃省教育厅产业支撑计划项目(2021CYZC-02);2024年度甘肃省重点人才项目资助
中图分类号	TP212;TP18
原始文献类型	学术期刊
引用统计	无
文献类型	期刊论文
条目标识符	https://ir.lut.edu.cn/handle/2XXMBERH/171391
专题	电气工程与信息工程学院
作者单位	兰州理工大学电气工程与信息工程学院
第一作者单位	电气工程与信息工程学院
第一作者的第一单位	电气工程与信息工程学院
推荐引用方式 GB/T 7714	张虹芸,陈辉,张文旭. 扩展目标跟踪中基于深度强化学习的传感器管理方法[J]. 自动化学报,2024.
APA	张虹芸,陈辉,&张文旭.(2024).扩展目标跟踪中基于深度强化学习的传感器管理方法.自动化学报.
MLA	张虹芸,et al."扩展目标跟踪中基于深度强化学习的传感器管理方法".自动化学报 (2024).

条目包含的文件
条目无相关文件。

个性服务

查看访问统计

谷歌学术

谷歌学术中相似的文章

[张虹芸]的文章

[陈辉]的文章

[张文旭]的文章

百度学术

百度学术中相似的文章

[张虹芸]的文章

[陈辉]的文章

[张文旭]的文章

必应学术

必应学术中相似的文章

[张虹芸]的文章

[陈辉]的文章

[张文旭]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量83774
全文量27057
访问量8219840
下载量1195234