文件自动分类系统delphi

文件自动分类系统delphi

ID:24339736

大小:50.50 KB

页数:3页

时间:2018-11-13

文件自动分类系统delphi_第1页
文件自动分类系统delphi_第2页
文件自动分类系统delphi_第3页
资源描述:

《文件自动分类系统delphi》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、文件自动分类系统Delphi毕业文件自动分类系统摘要:随着网络信息的迅猛发展,信息分类已经成为人们获取有用信息不可缺少的工具,文件自动分类系统是信息分类的重要研究方向,它是指在给定的分类体系下,根据文件的内容自动判别文件类别的过程。目前,向量空间模型是进行大规模文件处理的最佳模型,首先对向量空间模型进行了研究和探讨,包括:向量空间模型的基本概念、特征项的选择、特征项的提取算法等等。然后,本文介绍了几种常用的基于向量空间模型的文件分类算法,同时描述了具体的算法步骤。针对训练样本收集整理工作困难的问题,本文重点探讨了文件分类算法结合的可能性,并具体提出了1种实际可行的的文件分类系统的设计方法,

2、该分类系统由训练过程、分类过程两部分组成,系统采用细致的模块化设计,具有很强的扩展性和灵活性。在本文提出并实现的文件分类系统上,进行了测试工作,并得到了严格的实验数据。关键词:文件分类;向量空间模型;特征项的提取;特征项的选择AutomaticclassificationofdocumentssystemABSTRACT:Inrecentyears,informationcategorizationturnsmoreandmoreimportantforustogetusefulinformation.FileCategorization,i.e.automatedassigningfil

3、estopredefinedcategoriesbasedontheircontents,isataskofincreasingimportance.Noodelforlargescaleoffileprocessing.Firstly,,including:basicconceptionofVSM,FeatureSelectionandFeatureExtraction.ThesecondpartistheintroductiontoseveralmonFileCategorizationmethodsandthealgorithmsarepresentedindetail.(lanyi

4、mportantfileclassificationproblems,acquiringclasslabelsfortrainingdocumentsiscostly.ThispapershoallnumberoflabeleddocumentscanbeimprovedbyusingVSMmethods.Theproposedclassificationsystemisdividedintothasgoodscalabilityandflexibility.Basedonthefileclassificationsystem,uchuchprecisedata.KeyericalTaxo

5、logy),也大大推动了信息处理技术前进的步伐[3]。1.2系统概述系统可对文件集进行有序的组织,即把相似的、相关主题的文件组织在1起,从而为用户提供更高效的搜索与更准确的查询结果。除了作为文件集的组织工具,文件分类系统还有更广泛的应用:①电子会议:通过对与会者意见、建议进行分类以确定进1步讨论的主题。②邮件分类:对用户收到的电子邮件按主题进行分类。③信息过滤:根据用户的要求,将相关文件分配给可能感兴趣的用户。文件分类系统的实现通常有统计方法与知识工程方法两种技术。知识工程方法必须编制大量的推理规则,费时费力,代价很高,因而不大适用于复杂的系统。而统计方法的实现较为简单,且在实际应用中表现

6、出良好的性能,因此得到了广泛的应用。系统采用了基于概率统计的方法。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。