隐性语义标引法在知识推送系统中匹配应用

隐性语义标引法在知识推送系统中匹配应用

ID:33544743

大小:53.73 KB

页数:3页

时间:2019-02-27

隐性语义标引法在知识推送系统中匹配应用_第1页
隐性语义标引法在知识推送系统中匹配应用_第2页
隐性语义标引法在知识推送系统中匹配应用_第3页
资源描述:

《隐性语义标引法在知识推送系统中匹配应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、隐性语义标引法在知识推送系统中匹配应摘要在隐性语义标引法的理论基础上,从企业知识共享角度出发,基于角色知识需求驱动,研究知识主动推送过程中的知识匹配;分析隐性语义标引法特征词-文档矩阵的构建以及相似度的计算;并以产品成本控制相关知识文本作为测试文档,测试结果表明基于隐性语义标引法能够有效地对相关的知识进行匹配,实现角色知识的推送,达到知识共享的目的。关键词知识管理知识推送隐性语义标引法知识匹配中图分类号:G252.7文献标识码:A一、引言知识管理的一个最基本的问题就是促进组织成员之间的知识共享。然而,对一个普通的用户来说,从知识库中搜索知识是一件很耗时和耗精力的事情。因此,企业的

2、知识管理平台有必要为员工提供一种更加便捷的模式,而知识推送系统就是这样一个"知识找人”,而非“人找知识”的系统。在产品的全生命周期过程中,设计过程、制造过程、销售过程中,不同角色所需的知识不同。员工根据自己的岗位的角色需求,从企业知识资源库中搜索自己需要的知识,然后由知识主动推送系统将知识返回给员工-。要将员工的需求信息主动的推送给需要知识的角色,关键是实现员工的知识需求与知识资源库中对应的角色知识的准确匹配。为了使知识能够在适当的时候主动地传递给适当的员工,本文基于隐性语义标引技术建立了知识推送的主动匹配模型,探讨知识匹配模型算法的实现,实现企业知识有效流动和全面共享的目的。二

3、、隐性语义标引法的基本思想隐性语义标引法(LatentSemanticIndexing,LSI)是由DumaisST.等五位学者共同提出的一种自然语言处理方法。LSI采用向量空间模型的表示方法,首先,将全部的知识文档集中生成一个特征词-文档矩阵,矩阵中的每一个分量与某个特定的特征词在某个特定文档中出现的次数及位置相关。然后将该矩阵进行奇异值分解(SingularValueDecomposition,SVD),较小的奇异值被剔除。再将文档向量和查询向量映射到经奇异值分解后的子空间中,在该空间中,原来的特征词-文档矩阵的语义关系被保留,同时特征词用法的变异被抑制。最后可以通过标准化的

4、内积来计算查询向量与文档向量之间的夹角余弦相似度,根据相似度的大小,将按照相关性排序后的文档知识返回给用户。SVD分解的过程如图1所示。三、基于隐性语义标引法的知识匹配在知识的主动推送中,系统的主要功能之一就是根据角色需求驱动的知识匹配模型,实现角色与职责的匹配[2]。知识主动推送体系框架包括用户层、需求匹配启动层和知识资源层。用户根据自己的岗位需求,提出知识查询请求,知识推送系统根据用户的角色行为分析和任务情境分析,对知识资源库的知识进行匹配、过滤,将结果信息根据自己的岗位需求,提出知识查询请求,知识推送系统根据用户的角色行为分析和任务情境分析,对知识资源库的知识进行匹配、过滤

5、,将结果信息推送给用户。这样相应的任务处理人员就可以利用推送的相关经验、技能、原理等有关知识进行快速地决策和推理,从而更加快速、有效地完成自身承担的任务。现从知识资源层中提取关于'‘成本构成要素”的5个文档及文档的关键词,记作Docl-Doc5,员工根据自己的角色需求在知识推送平台中输入相应的请求,文档内容及关键词见表1.(一)特征值——文档矩阵的构建。LSI模型中,知识文档集合中共有m个不同的特征词tl,t2,...,tm和n个文档dl,d2,...,dn,构成一个m❷嘉的特征-文档矩阵,用X={}表示,其中每一行表示一个特征词的向量,每一列代表一个文档向量。计算方法为:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。