基于语义信息的面向数据库的top-k关键字查询技术

基于语义信息的面向数据库的top-k关键字查询技术

ID:33404884

大小:2.73 MB

页数:78页

时间:2019-02-25

基于语义信息的面向数据库的top-k关键字查询技术_第1页
基于语义信息的面向数据库的top-k关键字查询技术_第2页
基于语义信息的面向数据库的top-k关键字查询技术_第3页
基于语义信息的面向数据库的top-k关键字查询技术_第4页
基于语义信息的面向数据库的top-k关键字查询技术_第5页
资源描述:

《基于语义信息的面向数据库的top-k关键字查询技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级1932994学位论文基于语义信息的面向数据库的Top.k关键字查询技术作者姓名:周华慧指导教师:杨晓春副教授东北大学计算机软件研究所申请学位级别:硕士学科类别:工学学科专业名称:计算机应用技术论文提交日期:2008年1月3日论文答辩日期:2008年1月28日学位授予日期:答懒蝴:王夫艿评阅人:及跌铭乃辞;复东北大学2008年1月.,。粤《;‰誊氍。∥壤鬻≯磐矿黔p颡≈√。.。k肾.黔矿、,,,一。一√.¨~.*~4~,气{,I爹_j;“o帮.j。1芦“。~7也帮铤《列I『。,■q一。。一.。勰~q心督辐士j女,≥.、.、—.、:?,-一s

2、—k、AThesisfortheDegreeofMasterinComputerApplication1陀chnologytSemanticsBasedTop—kKeywordSearchTechnologyinRelationalDatabasesbyZHOUHua-HuiSupervisor:AssociateProcessorYf埘GXiao—ChunNortheasternUniVersi锣January2008鼍零—-一,≈,‘嘈焉㈡【LIIIIII卜/^.1。幕●■■■■Pu纛b门■l●●ii●—■■■■■■---l独创性声明本人声

3、明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示诚挚的谢意。学位论文作者签名:签字日期:闰绎装硼.夕,≯7

4、学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流

5、。(如作者和导师同意网上交流,请在下方签名:否则视为不同意)学位论文作者签名:风华稳、导师签名:掀签字日期:渊≯刁签字日期:硼·2‘7》■0玉降rkj1-^土k麓,㈠"i.~劳}*,o霉。、l【.▲LJ■,东北大学硕士学位论文摘要基于语义信息的面向关系数据库的Top—k关键字查询技术摘要越来越多的信息被存储在关系数据库中,面向关系数据库的关键字查询的需求也随之增多。尽管许多数据库管理系统支持全文本信息搜索,但是,在这些系统中,用户必须预先知道所要查询的关系数据库的模式结构,并且通过某种结构化的查询语言查询数据库。wreb关键字搜索的巨大成功,使

6、面向关系数据库的关键字查询成为一个崭新的研究领域。然而,面向关系数据库的关键字查询面临着三个挑战:(1)查询结果是由分散在不同关系表中的元组连接而成。(2)计算结果的相关度时,必须计算分散在各个关系表中的关键字与查询关键字之间的相关度。(3)与文本数据库相比,关系数据库的结构更复杂。因此,传统信息搜索领域的评分函数以及搜索算法不能直接应用到数据库关键字搜索中。本文通过研究元组的语义特性以及元组间的语义关系,提出一种新的评分函数。该评分函数不仅涵盖了当前的评分思想,并且用一些新的指标来衡量查询结果与查询关键字之间的相关性,从而更贴切和准确地衡量查

7、询结果与查询关键字间的相关度。基于新的评分函数,主要提出四种Top.k搜索算法。分别为基本算法、EBA(Early-stoppingBlockAlgoritllm)算法、AEBA(AdVancedEarly—stoppingBlockAlgorimm)算法、GAEBA算法(GlobalAdvanCedE砌y—StoppiIlgBlockAlgorimm)。后三种算法以数据块为处理单位,避免频繁访问数据库,因而提高搜索效率。AEBA算法在EBA算法基础上运用多表连接优化策略,避免了EBA算法存在的重复连接问题,从而进一步提高效率。EBA算法和AE

8、BA算法主要针对单个连接查询计划,而GAEBA算法利用一种优先调度机制,有效处理多个连接查询计划。另外,本文对当前的存在的稀疏算法进行了改进,使之能适应本文提出的评分函数。实验和分析证明,本文提出的评分函数的合理性以及EBA算法、AEBA算法、GAEBA算法的高效性。关键词:Top-k,关键字搜索,关系数据库,信息搜索,元组树一II—J■U√掣p囊▲■东北大学硕士学位论文SemanticsbasedT0p—kKeywordSearch1’echnologyinRelationalDatabasesAbstractW汕tlleamountofaV

9、ailableteXtda协inrelational蛐asesgro谢ngr印idly,tlleneedforordilla巧userstosearC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。