Institutional Repository of Coll Elect & Informat Engn
扩展目标跟踪中基于深度强化学习的传感器管理方法 | |
张虹芸; 陈辉; 张文旭 | |
2024-06-07 | |
发表期刊 | 自动化学报 |
ISSN | 0254-4156 |
摘要 | 针对扩展目标跟踪(Extended target tracking, ETT)优化中的传感器管理问题,基于随机矩阵模型(Random matrices model, RMM)建模扩展目标,提出一种基于深度强化学习(Deep reinforcement learning, DRL)的传感器管理方法.首先,在部分可观测马尔科夫决策过程(Partially observed Markov decision process, POMDP)理论框架下,给出基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)算法的扩展目标跟踪传感器管理的基本方法;其次,利用高斯瓦瑟斯坦距离(Gaussian Wasserstein distance, GWD)求解扩展目标先验概率密度与后验概率密度之间的信息增益,对扩展目标多特征估计信息进行综合评价,进而以信息增益作为TD3算法奖励函数的构建;然后,通过推导出的奖励函数,进行基于深度强化学习的传感器管理方法的最优决策;最后,通过构造扩展目标跟踪优化仿真实验,验证了所提方法的有效性. |
关键词 | 传感器管理 扩展目标跟踪 深度强化学习 双延迟深度确定性策略梯度 信息增益 |
DOI | 10.16383/j.aas.c230591 |
URL | 查看原文 |
收录类别 | 北大核心 ; CSCD |
语种 | 中文 |
资助项目 | 国家自然科学基金(62163023,62366031,62363023,61873116);甘肃省教育厅产业支撑计划项目(2021CYZC-02);2024年度甘肃省重点人才项目资助 |
中图分类号 | TP212;TP18 |
原始文献类型 | 学术期刊 |
引用统计 | 无
|
文献类型 | 期刊论文 |
条目标识符 | https://ir.lut.edu.cn/handle/2XXMBERH/171391 |
专题 | 电气工程与信息工程学院 |
作者单位 | 兰州理工大学电气工程与信息工程学院 |
第一作者单位 | 电气工程与信息工程学院 |
第一作者的第一单位 | 电气工程与信息工程学院 |
推荐引用方式 GB/T 7714 | 张虹芸,陈辉,张文旭. 扩展目标跟踪中基于深度强化学习的传感器管理方法[J]. 自动化学报,2024. |
APA | 张虹芸,陈辉,&张文旭.(2024).扩展目标跟踪中基于深度强化学习的传感器管理方法.自动化学报. |
MLA | 张虹芸,et al."扩展目标跟踪中基于深度强化学习的传感器管理方法".自动化学报 (2024). |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[张虹芸]的文章 |
[陈辉]的文章 |
[张文旭]的文章 |
百度学术 |
百度学术中相似的文章 |
[张虹芸]的文章 |
[陈辉]的文章 |
[张文旭]的文章 |
必应学术 |
必应学术中相似的文章 |
[张虹芸]的文章 |
[陈辉]的文章 |
[张文旭]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论