Query语义依存分析技术研究.pdf

Query语义依存分析技术研究.pdf

ID:51200356

大小:1.25 MB

页数:62页

时间:2020-03-20

Query语义依存分析技术研究.pdf_第1页
Query语义依存分析技术研究.pdf_第2页
Query语义依存分析技术研究.pdf_第3页
Query语义依存分析技术研究.pdf_第4页
Query语义依存分析技术研究.pdf_第5页
资源描述:

《Query语义依存分析技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、硕硕硕士士士学学学位位位论论论文文文Query语义依存分析技术研究RESEARCHONTECHNOLOGIESOFQUERYSEMANTICDEPENDENCYPARSING唐唐唐国国国华华华哈哈哈尔尔尔滨滨滨工工工业业业大大大学学学2012年年年6月月月国内图书分类号:TP391.2学校代码:10213国际图书分类号:681.37密级:公开工工工学学学硕硕硕士士士学学学位位位论论论文文文Query语义依存分析技术研究硕士研究生:唐国华导师:刘挺教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与

2、技术学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.2U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONTECHNOLOGIESOFQUERYSEMANTICDEPENDENCYPARSINGCandidate:TangGuohuaSupervisor:Prof.LiuTingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty

3、:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要互联网的飞速发展使得信息以前所未有的速度产生和传播,面对信息呈指数式增长、垃圾信息泛滥成灾的困境,搜索引擎如何找到对用户真正有用的信息遇到了很大的挑战。在传统的搜索引擎中,

4、用户输入查询(query),搜索引擎返回一个很长的网页列表。它不知道用户在问什么,不知道用户想找什么,只是通过基于关键字匹配的检索方式,把包含有关键词的网页找到;再通过网页排序的算法,将结果列表进行排序以后展示给用户,用户需要在很长的列表中,自己筛选出真正想要的信息。Query语义依存分析技术首先可以改善传统搜索引擎中的网页排序,它能够对query进行深层语义理解,从而更准确的理解用户的需求,减轻用户筛选信息的负担。另一方面,相对于传统搜索引擎,语义搜索近来受到工业界和学术界的广泛关注。和传统搜索引擎给出信息列

5、表不同,语义搜索将所有信息组织成一个庞大的知识库,面对用户的query,它直接从知识库中检索并返回答案。从而用户省去了自己筛选信息的步骤,更快速更直接地达到搜索的目的。Query语义依存分析技术可以帮助语义搜索引擎更深刻的理解用户需求,更准确的在知识库中进行答案的查找。除此之外,query语义依存分析技术还在自动问答、智能个人助手、信息检索、信息抽取等方向有着广阔的应用前景。本文提出了基于规则和基于统计的两个语义依存分析技术,主要研究内容包括:(1)Query语义依存分析和普通句子上的语义依存分析的异同。相对普

6、通句子来说,query具有长度较短且结构松散的特点,因而和普通句子上的语义依存分析技术有很大的差别。(2)Query语义依存分析的依存关系体系的确定,即根据query的特点,以及应用的需求,确定一个合适的依存关系体系。依存关系体系的确定,首先要考虑体系的完整性,是否能把主要的语义现象覆盖住。其次也要考虑技术上的成本、应用的需求等。本文确定了五类语义依存关系,分别是属性、限定、施事、受事、需求。其中限定关系又分了六个子类别,分别是时间限定、地点限定、数字限定、型号限定、疑问限定、否定限定。(3)针对六类特殊限定定

7、义明确简单的特点,提出了基于规则的query语义依存分析技术,包括规则的定义、规则的编制、规则的应用。-I-哈尔滨工业大学工学硕士学位论文(4)将语义依存分析问题转换为分类问题,提出了基于统计的query语义依存分析技术,包括语义资源的挖掘、分类特征的设计和选择。最终通过对比和实验说明了规则和统计两种方法的有效性。关键词:语义依存分析;语义搜索;搜索引擎;用户查询-II-哈尔滨工业大学工学硕士学位论文AbstractWiththerapiddevelopmentoftheinternet,information

8、isgeneratedandspreadatunprecedentedspeed.Atthesametime,garbageinformationisgrowinginanexponen-tialway.Howtofindoutreallyusefulinformationfromitbecomesgreatchallengeofsearchengine.Inthetraditional

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。