欢迎来到天天文库
浏览记录
ID:25482327
大小:64.18 KB
页数:3页
时间:2018-11-20
《基于内容管理系统中内容分类实现策略的研究毕业论文范》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、免费毕业论文请上www.zidir.com基于内容管理系统中内容分类实现策略的研究论文关键词:内容管理系统内容分类策略论文摘要:随着信息量以爆炸般的速度在急剧增加,当前在信息管理方面所面对的最严峻的挑战不再是信息匾乏,而是缺少时间和精力来对如此众多的信息进行浅析、归类与操作。本文探讨了在内容管理系统中内容分类的实现策略。 0引言 随着信息量以爆炸般的速度在急剧增加,当前在信息管理方面所面对的最严峻的挑战不再是信息匾乏,而是缺少时间和精力来对如此众多的信息进行浅析、归类与操作。因此内容的分类不仅有利于更快捷地实现内容的查询,而且有效的分类策
2、略同样有助于对纷杂的信息进行组织与归类,有助于人们缩小查询的范围,节省时间和精力。可见内容管理对内容分类的要求是十分必要的。 现在分类的策略大体上分为人工分类、自动化分类以及人机结合的混和策略三种。显而易见,人工分类是最容易被想到的。但是这种策略显而易见的过多的依赖于个人,且成本太高。并且当内容量过大的时候,单单依靠手工策略进行分类也不太现实,很容易成为系统的瓶颈。因此,人们更加关注于自动化分类策略。现在主要运用的自动化分类策略主要有以下几种策略。 1自动化分类策略 1.1基于规则的分类策略:这种策略需要由对相关内容极为了解的专家创
3、建与维护一套规则用于将某篇文档划分到某个类中。专家使用If-Then的规则形式组织归类的相关概念。规则能够支持复杂的操作,而且建立在规则之上的决策树也相当准确。规则衡量了一个给定的文档是否符合某个主题的判断标准。显然,建立这样一种规则并不容易,并且专家对相关内容知识的了解程度也相当重要。 1.2基于自然语言的学习算法:该策略利用神经网络的策略,通过浅析文档的内容区分文档并将文档进行分类。由于这种策略具有较高的容错能力及语言独立的操作性等特点,正在成为一种相对稳定的分类策略。这种策略通过选择文档的表示方式或可能的格式,利用神经网络实现对内容的分类
4、,可以被运用到文本文档或文本片断的分类中去。 1.3语义浅析:这是以以文档中提取关键的概念作为分类与检索的基础。语义浅析过程共分为两个阶段,第一个阶段的工作主要集中于一系列的语言算法以及语言独立的统计技术的实现。当用户对系统中收集的信息进行查询时则触发该过程的第二阶段,系统可以根据用户的查询需求以及可视化的分类结构呈现给用户个性化的、相关的查询结果。 1.4方式匹配:这种策略是指寻找经常聚在一起的一组词或词组的过程。一个主题可能通过语义浅析进行处理。其他的识别方式还包括词在文档当中的出现频率、词的位置、词与词之间的亲近程度以及相关词的聚类。方
5、式匹配策略具有语言独立的特点。免费论文写作指导www.jhlyzz.cn免费毕业论文请上www.zidir.com 1.5聚类浅析:这是通过识别内容中的共性元素将内容划分为相似内容子集。每篇文档可以看作一些内容的合集,聚类本质上就是将每一袋中的相似内容聚为一组。 以上每一种分类策略都有其自身的优点与不足,没有哪一种单一的分类策略是十全十的。每种策略都有其适用的方面。所以,现在人们往往采用混合的分类策略。下面我们着重浅析一种基于神经网络的分类策略。论文范文www.zidir.com 2基于聚类浅析的分类策略 聚类浅析是一种解决分类不
6、足的探测性的数据浅析策略。它的目标是把人、事务、事件等聚为组或类,每一类描述它的对象所属的类。该策略是通过建立一个对象间的相似性度量,使得类间的相似性尽量小,而类内的相似性尽量大,以而得到在某种判别准则之下的最佳分类,这种分类的结果未必使用简单的概念就可以描述的。换言之,其分类的标准并不是显而易见的。 假设特点向量由n个特点参数x,x,…,x组成聚类浅析按照一定的准则,将这些特点向量点划分为若干个群。聚类也用于将一个内容的集合划分为子集,也就是类。每一类内的对象之间都比该类对象与属于其它类的对象之间具有更大的相似性。 芬兰学者T.Kohone
7、n提出一种可以使得输入信号映射到低维空间,且保持相同特点的输入信号在空间上对应邻近区域的学习方式,称为Kohonen自组织特点映射(self-organizingfeaturemaps,SOFM)也称Kohonen自组织神经网络。本文来源:华融经济学论文网http://www.ihrd.com.cnKohonen自组织神经网络是一种前馈型网络。在这种类型的神经网络中各神经元接受前一层的输入,并输出给下一层,没有反馈。节点分为两类,即输入单元和计算单元,每一计算单元可有任意多个输入,但只有一个输出。前馈网络可分为不同的层,第I层的输入只与第I-1层
8、的输出相连,输入和输出节点与外界相连,而其它中间层则称为隐层。 前馈型网络,由于Kohonen自组织特点映射网络除了具备以下主要性能,
此文档下载收益归作者所有