基于贝叶斯算法的多语言文档分类

基于贝叶斯算法的多语言文档分类

ID:35070524

大小:6.34 MB

页数:56页

时间:2019-03-17

基于贝叶斯算法的多语言文档分类_第1页
基于贝叶斯算法的多语言文档分类_第2页
基于贝叶斯算法的多语言文档分类_第3页
基于贝叶斯算法的多语言文档分类_第4页
基于贝叶斯算法的多语言文档分类_第5页
资源描述:

《基于贝叶斯算法的多语言文档分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、"-?朵姆衙货一….於学校代码:10285学号;20134327108襄1牡聲SOOCHOWUNIVER别TY...耗.-基于贝叶斯算法的多语言文档分类.-f.PilincumentclassMultualdoificationbasedon:_gjf/Baesianalorithm'yg為■-研究生姓名'.指导教师姓名糞声蓉专业名称计算机技术研究方向计算机图像处理与识别^^

2、所在院部苏州大学计算机科学与技术学院论文提交日期2016年9月^K基于贝叶斯算法的多语言文档分类中文摘要基于贝叶斯算法的多语言文档分类中文摘要随着时代的变迁,信息技术得到了快速的发展且趋于成熟。人们对于信息的获取途径不再是通过报纸或者口口相传的方式,而是基于各种媒体的方式,如电视、电脑、手机等途径。面对信息量爆炸式增长,人们对于快速获取有用信息的要求不断提高。如何尽可能有效地组织和管理信息变得尤为重要。传统的单一语言文本分类系统在处理这些信息分类的问题上已经远远不能达到人们的要求

3、。因此,如何实现海量文本信息高效准确的多语言文档分类显得尤为重要。本文在阐述文本分类的发展历程基础上,通过比较分析贝叶斯算法、K-近邻算法和Rocchio算法,结合多语言特点,设计并实现了基于贝叶斯算法的多语言文本分类器的系统设计与实现,并对系统性能进行了简单测试,结果表明它能实现分类功能。关键词:文本分类,贝叶斯算法,多语言作者:朱娟指导老师:龚声蓉教授IAbstractMultilingualdocumentclassificationbasedonbayesianalgorithmMulti

4、lingualdocumentclassificationbasedonBayesianalgorithmAbstractAstimegoesby,informationtechnologyhasrapidlydevelopedandtendstogetmatured.Thewayforpeopletoobtaininformationisnolongeronlythroughnewspapersorthroughthewayofmouth-to-mouthtalking.Instead,peop

5、lenowacquireinformationthroughvarietiesofmedia,suchasTVs,computers,mobilephonesandsoon.However,withthemassdata,peoplehaveraisedtheirexpectionshowtogetusefulinformationinaveryshorttime.Thusitseemsmoreurgentwhetherinformationcanbeeffectivelyorganizedand

6、managed.Sincethetraditionalsystemofsingle-languagetextclassificationcannotmeetthedemandsofpeoplewhenclassifyinginformation,soitbecomesespeciallyimportanttodomultilingualtextclassification,whichcanclassifymassinformationaccuratelyandquickly.Afterstatin

7、gthecourseofdevelopmentoftextclassificationandmakingcomparisonsamongtheBayesianalgorithm,theK-nearestneighboralgorithmandtheRocchioalgorithm,thispaperdesignsandimplementsthesystemofmultilingualtextclassifierbasedontheBayesianalgorithm.Afterthesystempe

8、rformancehasbeentestedroughly,itturnsoutthatthissystemcandotheclassification.Keywords:textclassification,NaiveBayes,multi-languageWrittenbyZhuJuanSupervisedbyGongShengrongII目录第一章绪论...........................................................11.1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。