文本案例知识库构建的关键技术分析

文本案例知识库构建的关键技术分析

ID:32204793

大小:2.97 MB

页数:49页

时间:2019-02-01

文本案例知识库构建的关键技术分析_第1页
文本案例知识库构建的关键技术分析_第2页
文本案例知识库构建的关键技术分析_第3页
文本案例知识库构建的关键技术分析_第4页
文本案例知识库构建的关键技术分析_第5页
资源描述:

《文本案例知识库构建的关键技术分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西北大学硕士学位论文1)1997年,Burke等人开发了一个叫做FA时indcr的问答系统。这个系统的原理是:给定一个典型的问题输入,它将从包含经常被提问问题解答的FAQ公告板的文件中检索问题答案。每一个问答组合在实例库中被作为问题和解决方案来存储。FA叫indcr使用了联合语义和统计知识的技术,它始于一个基于向量空间模型的标准信息检索技术,在这个模型中案例作为包含文本集中权重的多个向量。此外,FA¨inder包含词之间相似性的语义定义,这些词是基于词网(Word.net)中的层次概念的【9】。2)1997年,Lenz和Burkhard实现TFALLQ的系统。这个系统是通过比较词

2、组之间的意义来实现推理的TCBR系统。案例包含一个问题空间,一些属性和一个解答空间,通过程序进程来处理词语组件来标识信息实体(InformationEntities,IE)。FALLQ的相似度评估是通过手工组建的词典和一个普通词典来检验词语之间的相似性。通过案例检索网(CaseRetrievalNets,CRN)来支持FALLQ的检索策略【101。3)1998年,MarioLenz等人在所著图书Case-BasedReasoningTechnology,FromFoundationstoApplicationsqb较早提出了基于文本案例的推理技术。作者主要从信息检索(Inform

3、ationRetrieval,瓜)模型的不足来考虑CBR处理文本案例的能力,提出针对,文本案例的CBR方法,并将其应用至0CBRAnswersProjects。4)1998年,Weber等人引入了一种半自动化的方法从文本文档中抽取案例信息。这种方法在特殊领域需要目标领域专家作为知识引擎,这些知识将为从文本到案例中抽取特征值做准备。这种方法的特征是:在不需要自然语言处理(NaturalLanguageProcessing,NLP)的情况下成功抽取知识。案例模板包括索引和被重复使用的特征,这些特征在一个被命名为PRUDENTRA的系统中展现给用户,以帮助用户手动选择文本案例并重用【1

4、1】。5)1999年,Bruninghaus和Ashley使用文本分类器实现了从文本到结构化案例表示的映射,并把这种方法成功的应用到SMILE系统中。在这个系统中案例文本被描述为词包(Bag.of-Words,BOW),并且使用了同义词和近义词处理【12】。他们关于此方法的论文BootstrappingCaseBaseDevdopmcntwithAnnotatedCaseSummaries,于1999年被国际CBR会议授予最佳论文,2003年被新西兰CBR组织认为是对TCBR最有贡献的论文。6)2000年,Wilson和Bradshaw发现案例表示需要包含文本性和非文本性的特征。

5、他们使用信息实体组的向量空间模型来衡量文本特征和非文本特征的相似性,并且在非文本特征中使用了案例相似度评估标准【13】。7)2001年,在SMILE最初的研究结果上,Bruninghaus和Ashley对BOW表示方式3第一章绪论做了两个革新。从训练案例中得到归纳,他们建议取代特有的案例名字和用句子在案例中的角色举例,并引进了命题模式(PropositionalPatterns,Props)、基于语法混合的词语特征。Props是由在例子中的词语和语法模式推断而来的,例如:主动、动宾、介词短语等形式。另外,Props包含关于否定和形容词标签的特定语义信息【14j。8)2004年,W

6、iratunga等人发明了一种全自动化的、用于抽取预兆特征来表示文本案例的方法。这些方法包含使用协作等规则发现词语间的语义关联的特征抽取方法。2005年Wiratunga等人扩展了此方案,引入能够生成表示关键词逻辑联系表示的命题子句,文本案例表示的结果包括可判断的特征,例如子句:智能V算法V(天才V应用)【15】。9)2004年,Cunning,ham等研究了在TCBR系统中用自动的图形组合来表示文本案例。此方法克服了BOW的局限性,把文本案例用图像来表示,节点是词语,相互关联的词之间有弧,并保留了词序,可以方便的获取如否定这样的特征。案例之间的相似度是通过图片间距离来计算的。该

7、方法的缺点是解决方案区分问题的特征带来了案例重用的局限性【16】。10)2004年,Gupta和Aha等人提出了在TCBR系统中使用自然语言理解的方法,这个方法起源于文本案例的一级表示【171。这个预想的系统为案例的动态表示也建立了相关属性。但是,这种方法面对的是极端的知识表示和工程学挑战,因为此方案已经超出了现有可行性技术的范畴。11)2005年,Bnminghaus和Astdey通过证明SMILE+IBP框架是如何通过SMILE把输入作为解释的CBR程序,IBP是如何对文本性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。