一种高效的模式匹配系统中文本检索器的检索策略.pdf

一种高效的模式匹配系统中文本检索器的检索策略.pdf

ID:57769262

大小:937.42 KB

页数:6页

时间:2020-03-31

一种高效的模式匹配系统中文本检索器的检索策略.pdf_第1页
一种高效的模式匹配系统中文本检索器的检索策略.pdf_第2页
一种高效的模式匹配系统中文本检索器的检索策略.pdf_第3页
一种高效的模式匹配系统中文本检索器的检索策略.pdf_第4页
一种高效的模式匹配系统中文本检索器的检索策略.pdf_第5页
资源描述:

《一种高效的模式匹配系统中文本检索器的检索策略.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第卷第期燕山大学学报年月文章编号:1007-791X(2008)04-0340-05一种高效的模式匹配系统中文本检索器的检索策略余靖(燕山大学信息科学与工程学院河北秦皇岛)摘要:随着语义网概念的提出和电子商务的不断发展,模式匹配问题成为人们普遍关注的焦点。本文针对模式匹配系统文本检索器存在的不足,提出了一个改进的文本检索器检索策略,并根据定义的逻辑不匹配属性判定定理对搜索树进行过滤,实现了搜索树规模的降低,提高了候选匹配的检索效率。关键词:模式匹配;检索策略;搜索树;候选匹配中图分类号:TP311.131文献标识码:A、、、、、引言和等等。然而,它们中的大

2、部分是由于对模式匹配的研究早在世纪年代就已经特殊的应用需求而开发出来的。其中仅有很少的几开始了。早期的模式匹配工作是为模式集成服务个,如:、和是以一种通用化的的。进入世纪年代,随着模式集成问题的发方式来解决模式匹配问题,这种通用化的方式能够展变化,模式匹配开始应用于将数据源集成到数据适用于不同的应用需求和模式语言。关于模式匹配仓库的过程中。在最近的年,电子商务的出现的研究大部分把重点放在发掘模式元素之间的进一步推动了模式匹配的研究。由于交易伙伴经常∶匹配,例如:一个∶一致性会详细的说明交换描述商务交易的信息,而通常情况下,每一个在源模式中的元素与目标模式中

3、的元交易伙伴使用他自己的信息格式,因此不同的消息素相匹配,或是与相匹配。然模式间的转换也需要模式匹配操作。近些年来,模而,∶匹配是很普通的,在现实世界模式之间式匹配作为模型管理应用中的基础性问题受到了的关系还包括很多的复杂匹配。一个复杂匹配指明人们的普遍关注。了一个模式与另一个模式中相一致的属性的组合。例如:它可以具体指明由于需求的不同,模式匹配工作大部分仍以人或。实际上,所考工(域专家或数据库管理员)定义方式为主,费时虑的异构模式中,复杂的匹配占全部匹配的一半左费力且容易出错。而这个问题也随着数据源右。因此,半自动的发掘复杂匹配技术的发展对于的快速增加与

4、电子商务的一体化而日趋严重。同任何实际的映射来说都是非常重要的。年时,随着系统处理数据库模式的日益复杂,数据库会议上,中数据规模的不断扩大,需要完成更多的匹配,手等提出的模式匹配系统就很好的解决工工作量与需要完成的匹配数目成正比。因此,需了此类问题,此系统不仅能够半自动的发掘模式间要找出一种通用的、自动化程度高的、可以应用于的∶匹配,而且能够较准确的发掘出复杂匹配。不同数据模型和应用领域的综合的模式匹配方法。虽然模式匹配系统能够高效的发掘模目前已经开发出了很多半自动的发掘模式匹式间的∶匹配和复杂匹配,然而,该系统在进配的系统和方法,例如:、、行模式匹配时,

5、文本检索器是对所有可能的候选匹、、、、、、收稿日期:作者简介:余靖(),女,湖北蕲春人。博士。主要研究方向为空间数据库,模式匹配,信息安全。第期余靖一种高效的模式匹配系统中文本检索器的检索策略配进行检索,并对候选匹配运用域约束和各种相应总之,所有可能的候选匹配数目越多,应用的算法进行初步的估价。正是由于文本检索器都要对匹配估价技术对候选匹配进行估价时所花费的估所有的候选匹配进行检索,而且所有可能的候选匹价时间越多,匹配检索的效率就越低。因此,需要配是无限多的,导致需要检索的候选匹配规模太在保证选取全面的、正确的估价技术对候选匹配检大。本文通过对系统文本检索

6、器的检索策略索的过程中过滤掉在逻辑上不正确的候选匹配,从进行研究,提出了一个改进的检索策略,根据定义而实现检索效率的提高。目前,模式匹配系的逻辑不匹配属性判定定理,对检索策略所构建的统在应用了全面的、正确的匹配估价技术的基础搜索树进行修剪,实现了搜索树规模的降低,提高上,实现了对所有可能候选匹配无遗漏的检索。了检索匹配的效率。例考虑两个关系模式和,如图所示。影响检索策略效率的因素对于目标属性,模式匹配系统中的文本检索器首先考虑所有可能的∶匹配:)候选匹配数目。为了能够在进行模式匹配时发掘模式间的∶匹配和复杂匹配,针对目标模式的每个属性,源模式中的每个属性与

7、源模式中其它属性间的组合都是的可能的候选匹配。。然后,文本检索器根据相应的估因此,为了实现对候选匹配无遗漏的检索,需要检价策略为上面的∶匹配分配一个匹配估价值。索目标模式属性所有可能的候选匹配。也就是说,对于这个匹配估价值的计算,文本检索器为目标列检索效率与所有可能候选匹配的数目成反比;属性分配一个训练实例集,通过这)匹配估价。为了判断候选匹配是否是逻辑个训练实例集训练出一个上正确的候选匹配,需要对候选匹配进行估价。而,从而对目标列属性建模,然后再估价的正确性取决于所选取的估价技术。由于基于把这个训练出来的应用属性名的估价技术往往会丢失正确的候选匹配,所到

8、源模式当中的各个属性的数据实例当中,从而来以在模式匹配初期应该应用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。