欢迎来到天天文库
浏览记录
ID:35065774
大小:3.00 MB
页数:59页
时间:2019-03-17
《基于文本分类的微博情感倾向研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、-:/契.B.則?萬/親馨,吗R蠢.-..為I.、译-壽'声-.'、,.vs;-a^A苗r义禾裝:?i\繁%:二Ar著rF,...沪鲁./,;草..?项±学位论文t'-'參!,、.-策导-書:奇?>r.??,,:叛;奇;A^剌斯^I^一轰"U賓雲/.:s.'讓^;y.一^屢 ̄碑—寒'狂:专袭—'f占?f吝若\為^>>.參義>气V毫:\盞.;-為义哺;s杨欢八人.達/謂这H,#.巧掉"聲覆;、..摸\|苗"\每:r.,巧祭/範..i'二s.壽'._./.;寇W.巧.I^
2、J'義舊s感%1垂.浮^;參V--哨?、裳.今x虐審巧^杨剛诚"慧?。;.^甚,.r‘#势齡构一.琴^名亂计师"、#1黃&:%好'i^方向数淵扭V产1.vVf..葦复I.r■詔I感■/a眶>*家嘉賓冬答c讀^:;—以./誉^J翁V巧曇.家?玄.;巧t毒‘.;.'.,.马.;體一V,J違.若.l^六則;V誠—.?攀孩麥:^..,乂/;.:霉片為;’.f馨:讀纔鱗巧U;叛蔑\r.:;r莫:/r-.:,.i々.:->终iK益舊接;
3、_警一知._独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的硏究工作的研究成果。除文中特别加^^示注和致谢的地方外,论文中及耿得了1不包含他人己经发表或撰写过的研究成果,,体不包含为获得軍庆师范一工大学或其他教育机构的学份或证书而巧用过的材料。与我作同的志对本研究所做的任何贡献均己在论文中作确的说。同了明明学位论文作者签名;签字日期:年月妹日i/学位论文版权使用授权书本学位论文作者完全了解重庆师范大学有关保、使用学留位论文的规定,有权保留并向国家有关部口
4、或机构送交论文的复印件。Pl和磁盘,允许论文被查阅和借阅本人暢巧軍庆师范大举WJ将学位论文内容编入有关数,x采用的全部或部分据库进巧检索可y影、。缩、印印或扫描等复制手段保存汇编学位论文学位论文作者签名;;i年签字日期月曰〇>?!(^重庆师范大学硕士学位论文基于文本分类的微博情感倾向研究硕士研究生:杨欢指导教师:杨德刚教授学科专业:计算机系统结构所在学院:计算机与信息科学学院重庆师范大学二〇一六年四月AThesisSubmittedtoChongqingNormalUniversityinPart
5、ialFulfillmentoftheRequirementsfortheDegreeofMasterResearchontheEmotionalTendencyofMicro-blogbasedonTextClassificationCandidate:YangHuanSupervisor:YangDegangProfessorMajor:ComputerSystemArchitectureCollege:CollegeofComputerandInformationScienceChongqingNormalUniv
6、ersityApril,2016基于文本分类的微博情感倾向研究摘要近年来,人们越来越依赖于社交软件来表达自己的观点,如使用微博、论坛、贴吧等渠道发表意见,表达情感。而人们对于热点事件和话题的各种各样的情感信息,则通过上述方式直观的反映了出来。因此,通过挖掘和研究大众对各类事件的情感倾向,可以达到对热点舆论的监控和大众看法的感知,为国家、企业等作出决策提供着重要依据。以往的信息检索及采集技术,多数是以关键词为基础,难以支持情感倾向的挖掘,信息提取和文本分类通常没有进行深层次的语义挖掘,因而对文本中所表达出的情感倾向无法进行
7、深层次的挖掘。因此在大数据时代,有效地利用数据挖掘及文本挖掘的相关知识,挖掘微博热点信息以及评论中的情感倾向,将在商品智能推荐、政府舆情监控、文本自动分类等方面有广阔的发展前景。本论文的主要研究内容如下:(1)对情感倾向分析和文本分类的相关概念和技术做了分析,包括微博短文本情感倾向分类以及文本分类的国内外研究现状、文本分类常用的几种算法:支持向量机(SVM),最大熵、决策树、人工神经网络算法等,并重点分析了传统的k最近邻算法,研究算法的基本思路以及该算法在文本分类当中的应用。(2)基于传统的k最近邻算法,并结合一定的关联
8、规则,本文提出了一种对于k最近邻算法的改进:基于主题--情感相关联的k最近邻算法,在文本分类时主题与情感相关联,进行特征值的组合,能够更好的确定k值,提高分类效率。(3)将改进后的基于主题--情感的k最近邻算法在微博热点信息数据集中加以应用,进行情感倾向正向、负向、中性三种分类实验,同时也利用传统的k最近邻算法进行对
此文档下载收益归作者所有