题名视觉词袋模型的改进及其在图像分类中的应用
作者杨浩
导师张永
答辩日期2017
学位名称硕士
关键词图像分类 视觉词袋模型 特征提取 概率潜在语义分析(PLSA) 视觉短语
摘要图像分类技术是计算机视觉领域中最重要和最具挑战性的研究课题之一,在图像检索,视频检索,医学应用等领域得到了广泛应用。近年来,众多学者对图像分类技术进行了深入的研究,视觉词袋(Bag-Of-Visual words,BOV)模型则是其中最成功、应用最广的一种图像分类模型。然而传统视觉词袋模型下的图像分类技术还有一些不足之处,本文将从以下几个方面对其改进:1.针对传统视觉词袋模型中视觉词典的规模过大与判别力差的问题,提出了一种加权最大相关最小相似(Weighted-Maximal Relevance-Minimal-Semantic similarity,W-MR-MS)视觉词典优化准则。首先提取图像的尺度不变特征转换(SIFT)特征,并用K-Means算法对特征聚类生成原始视觉词典;然后计算视觉词典中视觉单词与图像类别的相关性和视觉单词间的语义相似性,并引入一个加权系数综合两者对图像分类的重要程度;最后通过删除视觉词典中与图像类别相关性弱,且视觉单词间语义相似性大的视觉单词,从而达到优化视觉词典的目的。实验结果表明,采用优化后的视觉词典对图像进行分类提高了图像的分类性能。2.针对视觉词袋模型中图像局部特征空间分布信息的缺失与图像分类的语义性差的问题,提出一种基于概率潜在语义分析(PLSA)与视觉短语的图像分类方法。首先用W-MR-MS准则对视觉词典进行优化,并在优化视觉词典的基础上建立视觉短语,进而增加图像局部特征的空间分布信息;然后结合该视觉短语与优化视觉词典中的视觉单词,构建一个新的语义视觉词典;最后基于该语义视觉词典,采用PLSA对图像建立模型,挖掘出图像中更具语义性的潜在主题。实验结果表明,结合了视觉短语与PLSA模型的方法提高了图像的分类性能。
页数63
URL查看原文
语种中文
收录类别CNKI
中图分类号TP391.41
文献类型学位论文
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/92738
专题体育教学研究部
作者单位兰州理工大学
第一作者单位兰州理工大学
推荐引用方式
GB/T 7714
杨浩. 视觉词袋模型的改进及其在图像分类中的应用[D],2017.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[杨浩]的文章
百度学术
百度学术中相似的文章
[杨浩]的文章
必应学术
必应学术中相似的文章
[杨浩]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。