基于特征提取改进的ssvm文本分类设计与实现

基于特征提取改进的ssvm文本分类设计与实现

ID:35067857

大小:4.03 MB

页数:59页

时间:2019-03-17

基于特征提取改进的ssvm文本分类设计与实现_第1页
基于特征提取改进的ssvm文本分类设计与实现_第2页
基于特征提取改进的ssvm文本分类设计与实现_第3页
基于特征提取改进的ssvm文本分类设计与实现_第4页
基于特征提取改进的ssvm文本分类设计与实现_第5页
资源描述:

《基于特征提取改进的ssvm文本分类设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文基于特征提取改进的SSVM文本分类设计与实现作者姓名谢楚工程领域软件工程校内指导教师彭新一研究员校外指导教师臧根林高级工程师所在学院软件学院论文提交日期2016年06月TheDesignandApplicationofSSVM’sTextClassificationBasedonFeatureSelectionOptimizationADissertationSubmittedfortheDegreeofMasterCandidate:XieChuSupervisor:Prof.Pe

2、ngxinyiS.EZanggenlinSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP3学校代号:10561学号:201321033528华南理工大学硕士学位论文基于特征提取改进的SSVM文本分类设计与实现作者姓名:谢楚指导教师姓名、职称:彭新一研究员臧根林高级工程师申请学位级别:工程硕士工程领域名称:软件工程论文形式:ꇶ产品研发ꇶ工程设计√ꇶ应用研究ꇶ工程/项目管理ꇶ调研报告研究方向:嵌入式技术论文提交日期:2016年6月日论文答辩日期:

3、2016年6月5日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:王振宇委员:彭新一李挥朱映波吴一民‘华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中W明确方式标明。本人完全意识到本声明的法律后果由本人承担。^^月/S作者签名:>的日;^楚1日期/t

4、学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,目工大P;研究生在校攻读学位期间论文工作的知识产权单位属华南理学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子()校可W版;学,允许学位论文被查阅除在保密期内的保密论文外'、公布学位论文的全部或部分内容,可W允许采用影印缩印或其它复制手段保存。本人电子文档的内容和纸质论文的内容、汇编学位论文一致相。本学位论文属于::年月□保密,(校保密委员会审定为涉密学位时间__日)于

5、年_月__日解密后适用本授权书。保密,供校内师生和与学校有共享,同意在校园网上发布协议的单位浏览(光盘版);同意将本人学位论文提交中国学术期刊电子杂志社全文出版和编入CNKI《中国知识资源总库》,传播学位论文的全部或部分内容。""(请在W上相应方框内巧V)作者签名:部史曰期:知作'一"W/戊戶.6?化指导教师签名r杂日期一|j读..个-r,摘要随着社会的发展、科技的进步和知识的积累,产生了越来越多的文本数据,我们面临着如何从这些海量文本中提取有效信

6、息的问题。对这些文本数据进行分类能够为数据信息下一步的查询和处理提供有力的支撑。使用机器学习的相关算法进行文本分类是计算机处理文本的有效手段,在这些算法中支持向量机以其高维度、核函数和泛化能力强取得了不错分类效果。光滑支持向量机是近几年对支持向量机的一种改进,本文主要涉及的就是光滑支持向量机在文本分类中的应用。本文首先分析了中文文本在进行文本分类时的表现形式和特征提取问题。在向量空间模型表示方法中,需要使用特征提取的方法解决数据的高维度问题。特征提取的各种算法中计算开方校验值使用较多,本文通过详细分

7、析计算开方校验值过程中的不足之处,指出其没有考虑词频因素和低分布词的计算值较高两个问题。针对第一个问题加入了词频因子,对于第二个问题提出了一种低分布词的平衡因子,并对开方值改进之后的效果进行了分析。本文的第二个工作是将基于光滑支持向量机的文本分类进行了实现,详细设计了预处理、计算开方值、数据训练和数据测试的过程。最后对比分析了光滑支持向量机与支持向量的分类效果,以及开方值优化之后的分类情况。结果表明光滑支持向量机比支持向量机在分类准确度和分类速度上都有提高,改进之后的特征提取方式能提高分类结果的准确

8、度。分类实验效果符合优化设计的理论分析。关键字:文本分类;光滑支持向量机;特征提取IABSTRACTThedevelopmentofsociety,theadvancementoftechnologyandtheaccumulationofknowledgeresultinagrowingnumberoftextdata.Thereforewearefacingtheproblemthathowtoeffectivelyextractusefulinformation

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。