文本分类论文:文本分类 特征提取 文本情感分类

文本分类论文:文本分类 特征提取 文本情感分类

ID:16940043

大小:21.00 KB

页数:3页

时间:2018-08-26

文本分类论文:文本分类 特征提取 文本情感分类_第1页
文本分类论文:文本分类 特征提取 文本情感分类_第2页
文本分类论文:文本分类 特征提取 文本情感分类_第3页
资源描述:

《文本分类论文:文本分类 特征提取 文本情感分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、文本分类论文:中文文本情感分类的研究【中文摘要】文本情感分类是指通过挖掘和分析文本中的立场、观点、情绪等主观信息,对文本的情感倾向做出类别判断。随着人们在Web中表达自己观点这一现象越来越普遍,针对文本情感分类的研究也显得越来越重要。文本情感分类的关键技术有网页文本内容提取、文本表示(向量空间模型、布尔模型、概率模型)、特征提取(文档频率、卡方统计、互信息、信息增益、期望交叉熵、文本证据权)以及文本分类器(贝叶斯分类器、支持向量机、KNN、神经网络)。本文的主要研究内容和工作包括以下几个方面:(1)实现了网页文本提取技术,

2、并对文本预处理技术进行了研究。在研究从Web服务器获取网页源码技术的基础上,设计了一个正则表达式,以实现网页纯文本的提取,并设计和实现了向量空间模型表示文本的预处理方法。(2)设计并实现了基于情感词典的情感句识别算法和基于朴素贝叶斯的情感句识别算法来进行文本情感主观性分类:前者经过文本预处理、文本表示,通过与情感词典的比对得到主观句集和客观句集;而后者经过文本预处理、文本表示、提取特征,最后利用朴素贝叶斯分类模型得到主观句集和客观句集。实验表明,基于情感词典的情感句识别算法的分类效果要优于基于朴素贝叶斯的情感句识别...【

3、英文摘要】Textsentimentclassificationisautomaticallyclassifyingsentimentoftextbyminingandanalyzingsubjectiveinformationinthetext,suchaslocatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassassination.Linping,Zhejiang,1ofwhichliquorwinemasters(Wuzhensaidinforma

4、tionisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcamestandpoint,view,mood,andsoon.Itbecomesmoresignificantasmorepoepleexpresstheirviewpointsonweb.Thekeytechnologiesoftextsentimentclassificationcontaintextextraction,textrepresentation(vectorspacemodel,

5、Booleanmodelandprobabilitymodel),featureextraction(documentfrequency,chi-squarestatistics,mutualinformation,information...【关键词】文本分类特征提取文本情感分类【英文关键词】textclassificationfeatureextractiontextsentimentclassification【索购全文】联系Q1:138113721Q2:139938848同时提供论文写作一对一辅导和论文发表服务.保

6、过包发【目录】中文文本情感分类的研究致谢5-6摘要6-7ABSTRACT7-81引言11-171.1研究背景11-121.2文本情感分类的相关问题121.3国内外研究现状12-151.4本文主要研究内容15-161.5论文的组织和安排16-172文本情感分类关键技术17-332.1文本情感分类流程172.2网页文本内容提取方法17-202.2.1网页结构分析182.2.2目前存在的主要网页文本抽取技术方法18-202.3中文分词技术分析20-222.4locatedintheTomb,DongShenJiabang,def

7、erthenextdayfocusedontheassassination.Linping,Zhejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame文本表示技术分析22-252.4.1向量空间模型22-242.4.2布尔模型242.4.3概率模型24-252.5特征提取25-292.5.1文档频率25-262.5.2卡方统计262.5.3互信息2

8、6-272.5.4信息增益272.5.5期望交叉熵27-282.5.6文本证据权28-292.6文本情感分类常用分类器29-332.6.1贝叶斯分类器29-302.6.2支持向量机302.6.3KNN30-312.6.4神经网络312.6.5几种分类器优缺点的比较31-333文本情感分类算法结构33-3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。