IR
题名基于深度卷积网络的行人检测技术研究
作者陈志才
导师刘仲民
答辩日期2019
学位名称硕士
关键词行人检测 弱监督学习 多尺度感知 语义融合 特征金字塔
摘要行人检测主要是指对视频帧或者图像中指定的目标进行类别判断和定位的过程。在现实场景中,行人兼具刚性物体和柔性物体的特征,在姿态和动作上具有较大的随机性,再加上穿着打扮的多样性、远近距离的变化以及不同程度的遮挡等人为因素,都导致了行人在抽象特征上具有较大的类内差异。与此同时,在复杂的场景下,还存在光照、天气等随机性强的自然因素。这些人为因素和自然因素的结合给行人检测带来了很大的挑战。本文主要对基于深度卷积网络的行人检测技术进行研究,在通用检测技术的基础上,针对复杂场景下行人所具有的特点,设计高效、可靠,具有针对性的行人检测算法,在保证速度的情况下,有效提高检测精度。本文的具体工作如下:(1)对行人检测技术的研究背景和意义进行了阐述;介绍了行人检测以及包括目标检测在内的相关技术的国内外研究现状;对传统的行人检测框架进行了简单地描述并引入了深度学习的基本算法;最后对行人检测数据、模型的评价指标以及实验平台和开发环境进行了简单介绍。(2)提出了基于YOLOv2的高效行人检测方法。该模型以通用检测框架YOLOv2作为基本检测器,主要针对INRIA数据集展开设计,每次能够直接检测和识别整张图像中所有目标,具有相当高的效率。整个模型采用端到端的方式进行设计和训练,在较高的检测速度下,能够得到较高的检测精度。(3)提出了基于语义融合技术的多尺度感知行人检测方法。该模型以通用检测框架Faster R-CNN作为基本检测器,主要针对Caltech数据集展开设计,主要包括候选区域提取网络和分类网络两部分。整个模型分别通过CityPersons和Caltech数据集进行两阶段训练,在检测精度上达到了较高的水平。
页数68
URL查看原文
语种中文
收录类别CNKI
中图分类号TP391.41;TP18
文献类型学位论文
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/95203
专题兰州理工大学
作者单位兰州理工大学
第一作者单位兰州理工大学
推荐引用方式
GB/T 7714
陈志才. 基于深度卷积网络的行人检测技术研究[D],2019.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[陈志才]的文章
百度学术
百度学术中相似的文章
[陈志才]的文章
必应学术
必应学术中相似的文章
[陈志才]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。