受控语言与自然语言结合模式比较研究(1)

受控语言与自然语言结合模式比较研究(1)

ID:27169910

大小:75.35 KB

页数:10页

时间:2018-12-01

受控语言与自然语言结合模式比较研究(1)_第1页
受控语言与自然语言结合模式比较研究(1)_第2页
受控语言与自然语言结合模式比较研究(1)_第3页
受控语言与自然语言结合模式比较研究(1)_第4页
受控语言与自然语言结合模式比较研究(1)_第5页
资源描述:

《受控语言与自然语言结合模式比较研究(1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、受控语言与自然语言结合模式比较研究(1)随着信息传递的网络化,用户对检索语言也提出了差异性要求,需要检索语言和检索系统的交互更加方便、直接、透明。传统的中介行为已被抛弃,自主型“浏览检索”方式成为潮流。用户需求是服务性行业发展的动力,所以研发适应用户需求的新型检索模式也是大势所趋。规范化的受控语言与自然语言都有各自不可替代的优势,它们的优缺点处于相对、互补的状态。单独使用一种方式会因其缺点而迗不到较优的检索效率。网络环境下,二者的结合是提高检索效率的必然要求。1、受控语言与自然语言结合模式比较分析理想的检索状态是:在系统外部,用户可以灵活使用自己的语言检索和

2、组织信息,不需要看见和直接使用受控语言在系统内部,存在着以超级知识库为基础的、高度专业化的受控语言,支持用户自然语言提问的转换。受控语言与自然语言一体化模式有很多种,其中影响较大的有:词素相似度识别转换模式、一体化语言系统模式、概念空间模型、学科事物概念组配模式和后控制模式等。现将此五种结合模式在体系结构上的相似与差异性作一比较。五种结合模式的相似性它们的共同点是:基本都允许用户使用自然语言检索提问,由系统进行一定程度上的词汇转换与控制,支持用户易用性要求。在体系结构上都能够:①构建语义网络。即以概念为中心对词汇实施控制,通过识别概念之间的关系,建立一个与概

3、念体系相对应的具有层次结构的术语体系。②使用概念代码。以概念为中心,以唯一标识代码为主体是新型情报检索语言系统的特点。③使用入口词表。将符合语义索引要求的主题词或同义词、相关词反馈给用户,由用户来选择、确定他所需要的概念词,最后提交给索引系统进行检索。五种结合模式的差异性词素相似度识别转换模式其代表是EMT系统,它的每个主题词款目基本数据项有:款目主题词、汉语拼音、英文译名、范畴代号、注释、范畴名称、用项、代项、属项、分项、参项等[1]。另外在其基本数据项中又增加了释义和词素项。各主题词相互之间构成用代、属分、参照3类关系。各主题词款目之间的不同形式排列形成

4、主题词表的体系结构。主题词款目的各基本数据项间构成了一个概念语义网络群。具体做法是:将每个表的每个款目词均定义为热节点;两两相关节点之间均建立有向索引链进行链接;全部节点由结构链聚合形成整个语义网络。EMT系统根据转换知识库中的词素及词素同义对照关系,对主题概念或主题词进行分词整形,产生对应的词素标注集合。通过对主题概念与主题词所含词素相似度分析,便可实现主题概念到主题词的对应转换。标引文献时,文献主题概念可全部用自然语言词自由表迗。若主题概念与词表中的主题词一致,或与词表中的入口词一致,则可立即自动转换成主题词,并自动将主题词登录入标引结果字段[2]。词表

5、的入口率越高,与自然语言的自动转换能力就越强。此种模式针对汉语系统设计,相对于其他针对英文系统设计的模式来说还处于实验阶段。目前,此种模式只在《军用主题词表》中应用,效果理想。该系统有一定的推广价值,随着汉字信息处理技术的发展,特别是汉字自动分词技术的发展,此种模式一定会有广阔的前景。一体化语言系统模式其典型代表是美国国立医学图书馆设计的一体化医学语言系统。该系统的语义网络通过134种语义类型为超级叙词表中所有概念提供了一个统一的分类体系。UMLS系统语义网络的构建步骤是:各个语义类型组成语义网络的节点,节点与节点之间存在的关系即为语义关系。由语义类型及语义

6、关系构成网状的语义结构,它起着统领超级叙词表概念的作用。语义网络将全部概念划分成组,每一组共享几种特定的语义类型,语义类型又共享几种语义关系,使概念不仅高度结构化而且广泛联系。对于同一概念的不同术语以及不同的变异形式,UMLS采用了三级结构模式:概念,用唯一标识符CUI;术语,用唯一标识符LUI;词串,用唯一标识符SUI[3]。UMLS系统的特点在于:①其目标是受控语言和自然语言的一体化,编制的超级叙词表融先控制与后控制于一体,对概念词进行了不同层次、不同角度的控制。②专家词典程序可同时计算两个概念的共现频率、特殊事物的共现数据以及语义网络推理、识别和转换,

7、使系统的自然语言理解和处理成为可能。③具有更广泛的适用性,在各种系统、脱机环境和网络环境中都能很好的应用。UMLS系统已投入使用,目前已被广泛应用于医学领域信息系统的智能化检索、自然语言系统研究、专业词表的编制、医学专业搜索引擎的开发等方面。概念空间模型该模型语义网络的构建步骤是:对已识别、选定的概念通过概念共现率分析,得到任意两个概念一起出现的可能概率,将概念作为神经网络的节点,节点间非对称的关联系数作为神经元之间带权重的链接就是概念共现率,这样就构成了神经网络。在文本概念空间生成后,按概念空间的结构分层、分类地建立起具有联想功能的语义索引,然后将语义索引

8、按其在概念空间上的位置构成一个概念语义空间。概念语义

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。