关于语义距离及其运算

关于语义距离及其运算

ID:38786232

大小:27.44 KB

页数:6页

时间:2019-06-19

关于语义距离及其运算_第1页
关于语义距离及其运算_第2页
关于语义距离及其运算_第3页
关于语义距离及其运算_第4页
关于语义距离及其运算_第5页
资源描述:

《关于语义距离及其运算》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、论文3.2关于语义距离及其计算“语义距离”这个概念试图对概念之间关联性的强弱给以定量表述。关联性的定量表述有“相关函数”或“相关系数”这样现成的术语。所以直接采用“概念相关函数”或“语义相关系数”之类的术语比较自然,“语义距离”这个术语的引入在理论上并无必要,不过是取其表述简明而已,实际上语义距离的计算就是计算概念之间的相关系数。不同概念之间的关联性有明显的强弱之分,这是毫无疑义的。但是如何量化和如何计算,则需要新的思路,不可能照搬信号处理中求相关函数的统计方法。统计方法的出发点是将待考察的系统视为“黑箱”,但语句不是“黑箱”,即使是语音识别系统的输出语音阵

2、列,也只能说是一个“明暗相间、明为主导”的箱子,弃“明”而不用,显然是不明智的。概念之间的关联性需要通过多重层面予以表达,有概念层面的关联性,有词汇层面的关联性,有语法层面的关联性,有语义块内部的关联性,有语义块之间的关联性。不同层面相关系数的量化和计算方法都应该有所不同。对这些不同侧面的辩识是进行语义距离计算的先决条件,以语句物理表示式为立足点的句类分析,是判断这些先决条件的强有力武器,在上一节针对十个例句作了示范性说明。这是语义距离计算的基本特点。相关函数是一个条件概率,语义距离的条件性更为突出,在某种意义上,条件的把握是计算语义距离的关键。下面将对条件

3、进行具体的说明,上一节对十个例句的分析都是侧重对条件的阐述,从中可以看到,句类知识是最基本的条件。当然,在某种情况下,对条件可以弱化。语法学所概括的词性约束规则:即形容词与名词、副词与动词和形容词、数词与量词的搭配规则就是明显的例子。这些搭配实际上是有条件的,但作为语法规则来陈述,可以不管条件。概念关联性或语义距离的概念,在某种意义上是对上述词性约束规则的扩展和深化。扩展表现在它力图表述语义块之间或语句要素之间的约束,深化表现在它力图尽可能给出条件。语句要素之间的约束就是[1]中所阐述的链式关联,这一知识分别从概念层面和词汇层面进行表达。前者的表述是概念关联

4、性知识库的内容[6],后者的表述是词语知识库的内容[7]。条件则通过句类知识、交式关联和“同行优先”三条途径来表述,后两条实际上就是词性匹配的具体条件,第一条是运用链式关联知识的条件。从上面的说明可知,语义距离的计算首先要区分语义块之间两种情况。语义块内部语义距离的计算主要是运用:“同行优先”准则;概念关联性知识库中“交式关联”知识[6];语义结构方程所给出的语义块构成知识[7]。p69语义块之间语义距离的计算主要是运用:概念关联性知识库中的基本句类知识和概念节点的链式关联知识;语义结构方程所给出的搭配知识。所谓“同行优先”准则,是对层次网络符号天然属性的一

5、种简明陈述,正式的陈述是:同行的五元组概念及挂靠的(w,p)类概念优先相互搭配,在[1]中曾对此详加阐述。从应用的角度来看,这不过是用数字符号表达概念关联性的一个简单技巧。在具体应用这一准则于语义距离计算时,要区分四种不同的搭配方式,因为每种搭配方式各有自己的约束准则。四种搭配方式是:修饰型搭配;补充型搭配;并合型搭配;对象内容型搭配。前三种是语义块内部的搭配,第四种则表现为语义块之间的搭配。下面就来对这四种搭配作较详细的说明。——关于修饰型搭配修饰型搭配大体上相应于语法学的上述词性约束规则,“同行优先”准则不过是对此规则的运用条件给以表述。“衷心的祝福”、

6、“衷心的石头”、“衷心的消息”都是形容词与名词搭配,但后者不合理。“衷心地希望……”“衷心的诅咒……”都是副词与动词的搭配,但后者不合理。把这些词汇映射成层次网络符号,通过语义距离计算,计算机不难得到“衷心的祝福”“衷心地希望”语义距离最小的结论,不难作出“衷心的诅咒”绝对不合理的结论。同时,也不难得到“衷心的石头”“衷心的消息”不合理的结论。对修饰型搭配的语义距离计算,就是将两概念的层次符号从高往低逐层匹配,“相同得分,相异不计”,它类似于在极性重合相关处理时期对相关系数的简化计算。但计算前必须进行约束性检验,对修饰型搭配来说,需要作两项检验:一是词性及其

7、顺序的检验,二是对偶性检验。两概念组合的合理性或合法性,可从关联性和排斥性两个角度进行考察。排斥性可视为反关联,相应于相关函数的负值。但在语义距离计算时,仅取正值,负值一律视为相斥。从这个意义上说,约束性检验就是互斥或正负检验。不满足约束条件,就意味着互斥,表示两概念不能组合,这一结果对于解模糊或纠错处理最为实用。词性约束是常规的语法知识,无庸赘述。需要说明的只是它的两条顺序约束:一,gu类概念作为形容词使用时,在顺序上可前可后,但ug类概念优先于前;二,u及vu类概念作为副词使用时,在顺序上可前可后,但uv及uu类概念优先于前。参见存疑录上面例句10中的“

8、日益恶化”就是一个典型的同行修饰搭配,“日益”就个u

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。