欢迎来到天天文库
浏览记录
ID:34665321
大小:6.44 MB
页数:123页
时间:2019-03-08
《web搜索用户兴趣和智能优化的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名::醚日期:垒!兰年旦月翌日学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,
2、可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。作者签名:缒导师趁二磊:兰生年生月生日摘要随着信息技术的飞速发展,互联网信息量正呈爆炸性增长,万维网已成为一个巨大而复杂的信息空间,人们已从信息缺乏转变为信息过载。互联网信息具有分散、无序、海量等特点,如何从浩瀚的信息资源中快速、有效、准确地找到所需信息是一个具有挑战性的研究课题,Web搜索正成为互联网领域的研究热点和焦点之一。传统的Web搜索算法注重于Web的链接结构和Web页面等级
3、权重,而忽略了用户的兴趣行为,导致了部分搜索结果不完整及准确率低。此外,通过迭代计算出每个网页的Hub值和Authority值的方式,导致Web搜索的效率较低,并容易出现一定的分散和泛化现象。针对传统的Web搜索算法存在的缺点,本文在总结和分析国内外相关研究工作的基础上,充分结合用户的兴趣行为和相关的智能优化算法来展开研究,主要研究内容及创新性工作概括如下:(1)综述了有关搜索引擎结构及其工作流程、传统Web搜索算法设计思路和启发式算法模型的研究成果及方法,为研究Web搜索算法基础理论的研究者提供参考和借鉴。(2)在分析现有用户兴趣模
4、型表示方式的基础上,针对Web搜索的特点,结合用户浏览行为、用户反馈行为、关键词权重以及短期兴趣和长期兴趣等相关因素,设计了一种基于Web搜索的用户兴趣模型,为后续研究Web环境下的启发式搜索算法奠定基础。(3)在充分结合遗传量子算法和克隆选择算法优点的基础上,提出一种克隆遗传量子搜索算法(ClonalGeneticQuantumSearchAlgorithm,CGQSA),详细介绍了该算法的设计思路和框架,并运用Markov链理论对其收敛性进行分析。同时,具体分析了该算法的计算复杂度,实验结果表明CGQSA算法具备良好的稳定性和可扩
5、展性,其性能明显优于其它的传统Web搜索算法和启发式算法。(4)结合关键词的链接权重和Web页的链接结构,设计一种评估Web页平均权重的数学模型,将每个Web页表示成种群中的一个个体,并用一个适应度函数对其性能进行评估。(5)在遗传算法的基础上,融入模拟退火算法的思想,提出一种遗传模拟退火搜索算法(GeneticSimulatedAnnealingSearchAlgorithm,GSASA),详细介绍了该算法的设计思路和框架,并对其收敛性进行了具体分析。GSASA算法将遗传算法和模拟退火算法的优点充分结合起来,并充分考虑Web搜索的实
6、际应用环境,在较大程度上提高了算法的运行效率和求解质量。仿真实验取得了较理想的实验结果,从而表明该方法是可行和有效的。我们所得结果是Web搜索算法理论方面的一些一般性的理论成果,这些成果对于设计与实现Web搜索算法仍然具有指导意义。更重要的是,我们所引入的分析手段与方法对于W曲搜索算法的相关理论研究具有较为广泛的适用性和参考价值。关键词:Web搜索,链接分析,遗传模拟退火搜索算法,克隆选择算法,量子遗传算法ABSTRACTWiththerapiddevelopmentofinformationtechnology,theamounto
7、finformationontheIntemetisgrowingrapidly.Webhasbecomeahugeandcomplexinformationspace,andthelackofinformationhastumedintoinformationoverload.InformationontheInternetisdisperse,disorderly,andimmenseinamount;therefore,itisagreatchallengeforpeopletofindquickly,effectivelyan
8、daccuratelytheinformationneededfromthevastinformationresourcesontheInternet.WrebsearchiSbecomingahotandfocalpr
此文档下载收益归作者所有