IR
题名基于领域本体的垂直搜索引擎页面排序算法的研究
作者王清霞
导师张永
答辩日期2014
学位名称硕士
关键词搜索引擎 本体 排序算法 电子商务领域
摘要伴随着网络信息资源的剧增,搜索引擎的重要性与日俱增。网页排序算法是检索引擎关键部分。如何有效的查找需要的信息是非常关键的,一个好的搜索引擎可以极大的节省用户查找信息的时间。搜索引擎包含多个组成部分,其中网页排序结果的准确率直接决定了搜索引擎的性能和用户体验。信息检索领域中有许多的网页排序算法,其中基于链接分析的算法运用比较广泛。通过对垂直搜索引擎的工作原理与架构、本体等相关技术的研究,在此基础上,对基于电子商务领域本体的模型构建、语义因素、排序算法优化进行了深入的研究。主要研究内容包括以下几个方面:1.通过研究现有的页面排序算法,分析了存在的不足,并介绍了网页的评价标准,针对返回结果相关性、用户的体验、响应时间等问题,提出了基于PageRank算法的改进策略,将语义因素应用在垂直搜索排序算法中,从而提高了搜索结果的准确率2.本体相关技术的分析,构建规则,建模元语以及分类,构建了电子商务领域的本体,并引入WordNet语义关系的词典,运用在垂直搜索引擎的排序算法中。在此基础上,提出一个基于电子商务领域的概念相似度计算方法。通过编程实现了词网络,即给定一个词语能够查出该词的所有同义词,并通过实验验证了改进后的相似度算法在中英文环境下进行语义相似度计算效果。3.对基于领域本体的垂直搜索引擎系统实现,将改进的PageRank算法应用在本系统中,系统包括信息获取模块、Lucene索引模块、本体的构建与管理模块和查询扩展与结果展示模块。最后,用Loadrunner性能测试工具从吞吐量、平均响应时间,Hits/second三个方面验证了系统的性能,最终得出价值程度较高的页面,进而满足用户的需求。
页数61
URL查看原文
语种中文
收录类别CNKI
中图分类号TP391.3
文献类型学位论文
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/90174
专题兰州理工大学
作者单位兰州理工大学
第一作者单位兰州理工大学
推荐引用方式
GB/T 7714
王清霞. 基于领域本体的垂直搜索引擎页面排序算法的研究[D],2014.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[王清霞]的文章
百度学术
百度学术中相似的文章
[王清霞]的文章
必应学术
必应学术中相似的文章
[王清霞]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。