基于引文上下文分析的文献检索技术研究

基于引文上下文分析的文献检索技术研究

ID:34632420

大小:22.84 MB

页数:162页

时间:2019-03-08

基于引文上下文分析的文献检索技术研究_第1页
基于引文上下文分析的文献检索技术研究_第2页
基于引文上下文分析的文献检索技术研究_第3页
基于引文上下文分析的文献检索技术研究_第4页
基于引文上下文分析的文献检索技术研究_第5页
资源描述:

《基于引文上下文分析的文献检索技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号UDC密级单位代码10151基于引文上下文分析的文献检索技术研究张金松指导教师陈燕职称教授学位授予单位大连海事大学申请学位级别博士学科与专业管理科学与工程论文完成日期2013年7月论文答辩日期2013年11月答辩委员会主席文J兹pCitationContextBasedAnalysisTechnologiesonScientificLiteratureRetrievalAthesisSubmittedtoDalianMaritimeUniversityInpartialfulfillmentoftherequirementsforthedegreeofDoctorofManagement

2、byJimgZhangJinsong:Lhang(ManagementScienceandEngineering)ThesisSupervisor:ProfessorYanChenJuly20131砌illll删ii舢㈣砌删啪舯硼。Y2504879大连海事大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博士学位论文!基王曼l塞土王塞盆堑的塞筮捡塞堇盔堡塞:。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经公开发表或未公开发表的成

3、果。本声明的法律责任由本人承担。学位论文作者签名:主壁坌抠学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。同意将本学位论文收录到《中国优秀博硕士学位论文全文数据库》(中国学术期刊(光盘版)电子杂志社)、《中国学位论文全文数据库》(中国科学技术信息研究所)等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文

4、在解密后遵守此规定。本学位论文属于:保密口在——年解密后适用本授权书。不保密∥(请在以上方框内打“√”)论文作者签名:旁毓导师签名:p球篓日期:山岛年11月7日创新点摘要1.提出一种基于引文分析方法的知识域可视化表示方法,利用引文概率分布距离的计算方法能够完成知识域可视化的表示,该方法以引文分析的假设为基础,利用主题间的相互关系,进行知识域可视化的表示,从而描述某一领域内的重要特征,揭示出文献主题间的内在联系,促进文献可视化表示的研究。2.提出一种基于引文上下文的文献排序算法,鉴于引文分析方法认为存在引用关系的两篇文献间具有某种必然联系,为了将这种联系进行定量化研究,本文将抽取的引文上下文信息

5、进行主题模型训练,从而建立有向、加权引文网络,并将顶点权值、边权重两个先验概率对PageRank算法进行改进,从而建立了一种与主题相关的文献排序方法。3.将基于引文上下文的排序算法应用于作者权威度分析、文献检索模型以及段落检索的研究中。一方面,可以将作者权威度作为影响因素对基于引文上下文的排序算法进行优化;另一方面,利用基于引文上下文的排序算法可以对传统基于语言模型的信息检索模型进行改进,建立一个与主题模型相关的文献检索系统;同时,将基于引文上下文的排序算法应用于段落检索的研究中,可以使文献检索的准确率有所提高,从而更好的满足用户检索的需求。中文摘要摘要随着大数据时代的到来,科学文献越来越多的

6、以电子化文档的形式存在于网络中,这不仅能够促进文献的传播与推广,更能促进科学研究水平的发展,使研究者达到“站在巨人的肩膀上’’的目的。然而,大量电子化学术文献的产生,不仅存在良莠不齐的问题,同时为文献管理提出了新的挑战,如何对文献进行有效的表示、筛选、应用,已经成为当今知识管理领域研究的热点问题之一。因此,本文将文本挖掘、信息检索等相关方法应用于文献检索技术的研究中,以引文分析方法为基础,利用引文上下文的相关语义信息,融合主题模型、排序算法、语言模型、网络图等理论,实现文献知识域可视化表示、文献排序算法的研究、文献检索模型的构建等,并选取相关学术论文数据对各个知识点进行实验验证。本文的主要研究

7、内容可以包括:1.基于引文分析法提出一种引文概率分布距离的计算方法,并将其应用于文献知识域可视化的研究中。2.抽取引文上下文的文本信息,利用Labeled.LDA主题模型获得有向、加权引文网络中顶点权值与边权重两个先验概率,改进传统PageRank算法,实现基于引文上下文的文献排序方法(Context.BasedRankingAlgorithm,CBRA)研究。3.将基于引文上下文的排序方法应用于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。