基于文本挖掘的文本情绪分类

基于文本挖掘的文本情绪分类

ID:35065785

大小:2.95 MB

页数:57页

时间:2019-03-17

基于文本挖掘的文本情绪分类_第1页
基于文本挖掘的文本情绪分类_第2页
基于文本挖掘的文本情绪分类_第3页
基于文本挖掘的文本情绪分类_第4页
基于文本挖掘的文本情绪分类_第5页
资源描述:

《基于文本挖掘的文本情绪分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、、'乃;、、?、,一V.-、—二-"'?t-rS?.-rf又./:分类号密汲UDC学校代码^;'—; ̄:-'';.气产'觀云寺若办fi44考产>#/..這為.、一':.--.iN:iTvri-參、;U.v4\iwvFB"wn、^N;ntmvm、X':yLp"cs'Vv.V,.'?..'.、-'、、?..、.vc\A节V:成,餐.,护、'.:.公繁转适.藏慧薦,苗心乃,讓妒如囊誦"、"-躬终緩為等气為心棘

2、紋读t气-满晦.一:"、'-心'.帮於售邏'課方学术硕±硏究生学位论文-端沪補麵、?..'.';/';户’成价..fV-v—.:.、''彌'-'■.;,..、/私;礙—VM‘、'''^-/.貧黎...苗.礙=基于文本挖擺的文本情绪分类1i峡苦;g'’—、;—''-'.苦-?療%,.齊、為.;纔、'.'、,■、产心:皆:礙苟巧已.'—学院:统计与数学学晓(部、所):琴袁每、'巧?、資:统计学(巧经济学学化)交专业已繁

3、,^-向苗研究方:金巧大数搪_:‘:A;,,心r所;;姓名:徐音创;;品.、点.二:或、:石教授导师巧著声'一--:;-'、‘—.'、^V:/.'一''''---.,:、一*山>'''—骇於片‘一'皆.式、?"'凉'..一''''.-]—-、''?-.v'靴、二,二\^詔石式心”占V心卓苦巧 ̄户止201552065论文:1月起时间年月年六‘'4.'V乂:一;橡立.--;..'..:契_;幾耗!壽載-'‘?.'.方遍

4、瑪巧;'.,叮.V/—..-..三攻抗.聲说挤語说分,知,M‘心心^;气怒巧J兴货城焉纏麵诚哨為祭摘要摘要随着信息技术的进步,人们生活中出现了大量的、甚至海量的数据,其中蕴含着大量的价值,这就是“大数据”。金融行业与互联网技术的迅速发展产生的大量的互联网上的与金融相关的一种金融大数据:互联网中储存的金融文本数据。通过对这些类型的数据进行分析,提取其中的价值,是大势所趋。对于文本数据进行分析,文本挖掘技术是行之有效的方法。文本挖掘包括文本数据收集、文本信息提取、文本数据建模等多方面的研究内

5、容,本文基于文本挖掘中的文本分类方法对一组实际中常出现的“股吧”评论、帖子文本数据进行情绪分类。对于“股吧”文本数据的分析,本文使用从非结构化数据向结构化数据转化而进行建模的思路,首先说明如何得到一组与"股吧"信息一一对应的文本特征数据,并基于此数据进行分类建模。对于文本特征数据的建模,本文基于“数据驱动”的建模方式,即从“股吧”文本数据进行特征提取之后的文本特征数据集出发,通过交叉验证,寻找合适的分类模型进行建模,并提出了基于交叉验证结果的非参数统计的检验方法,科学的对这些模型的泛化能力进行评价,并从中

6、选择合适的、泛化能力稳健的模型对文本特征数据进行分类,从而完成对“股吧”文本数据进行分类。其中,本文提出了一种基于两分类模型的多重多折的交叉研究结果,使用适用于成对数据检验的非参数检验方法检验两模型建模效果的差异,提出了稳健的两模型泛化能力的比较方法。这也是本文的创新之处。本文在第一章的引言部分五节内容说明研究背景、研究问题、研究内容以及研究意义;其次,本文提出建模思路以及介绍、说明研究过程中使用的分类模型理论、降维理论、不平衡分类数据建模理论、多重多折的交叉验证理论以及非参数假设检验理论;再次,本文通过

7、对一组实际的“股吧”文本特征数据进行建模分析,并得出结论;最后,说明本文的研究结论与不足之处,以及展望了今后的研究方向。关键词:文本分类;文本特征;不平衡分类数据;降维;交叉验证;非参数假设检验IABSTRACTABSTRACTWiththeprogressofinformationtechnology,themassofdatahaveappearedintheworld,whichisBigknownasbigdata.Bigdatacontainsalargenumberofvalue.Financ

8、ialindustryandtherapiddevelopmentofinternettechnologyproducealargenumberoffinancialrelateddataontheinternet:thefinancialtextdatastoredintheinternet.Throughtheanalysisofthesetypesofdatatoextractthevalueisthetrendofth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。