兰州理工大学机构知识库

Lanzhou University of Technology Institutional Repository （LUT_IR）

图片搜索

粘贴图片网址

IR

题名	基于深度卷积网络的行人检测技术研究
作者	陈志才
导师	刘仲民
答辩日期	2019
学位名称	硕士
关键词	行人检测弱监督学习多尺度感知语义融合特征金字塔
摘要	行人检测主要是指对视频帧或者图像中指定的目标进行类别判断和定位的过程。在现实场景中,行人兼具刚性物体和柔性物体的特征,在姿态和动作上具有较大的随机性,再加上穿着打扮的多样性、远近距离的变化以及不同程度的遮挡等人为因素,都导致了行人在抽象特征上具有较大的类内差异。与此同时,在复杂的场景下,还存在光照、天气等随机性强的自然因素。这些人为因素和自然因素的结合给行人检测带来了很大的挑战。本文主要对基于深度卷积网络的行人检测技术进行研究,在通用检测技术的基础上,针对复杂场景下行人所具有的特点,设计高效、可靠,具有针对性的行人检测算法,在保证速度的情况下,有效提高检测精度。本文的具体工作如下:(1)对行人检测技术的研究背景和意义进行了阐述;介绍了行人检测以及包括目标检测在内的相关技术的国内外研究现状;对传统的行人检测框架进行了简单地描述并引入了深度学习的基本算法;最后对行人检测数据、模型的评价指标以及实验平台和开发环境进行了简单介绍。(2)提出了基于YOLOv2的高效行人检测方法。该模型以通用检测框架YOLOv2作为基本检测器,主要针对INRIA数据集展开设计,每次能够直接检测和识别整张图像中所有目标,具有相当高的效率。整个模型采用端到端的方式进行设计和训练,在较高的检测速度下,能够得到较高的检测精度。(3)提出了基于语义融合技术的多尺度感知行人检测方法。该模型以通用检测框架Faster R-CNN作为基本检测器,主要针对Caltech数据集展开设计,主要包括候选区域提取网络和分类网络两部分。整个模型分别通过CityPersons和Caltech数据集进行两阶段训练,在检测精度上达到了较高的水平。
页数	68
URL	查看原文
语种	中文
收录类别	CNKI
中图分类号	TP391.41;TP18
文献类型	学位论文
条目标识符	https://ir.lut.edu.cn/handle/2XXMBERH/95203
专题	兰州理工大学
作者单位	兰州理工大学
第一作者单位	兰州理工大学
推荐引用方式 GB/T 7714	陈志才. 基于深度卷积网络的行人检测技术研究[D],2019.

条目包含的文件
条目无相关文件。

个性服务

查看访问统计

谷歌学术

谷歌学术中相似的文章

[陈志才]的文章

百度学术

百度学术中相似的文章

[陈志才]的文章

必应学术

必应学术中相似的文章

[陈志才]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量83774
全文量27057
访问量8262516
下载量1204978