欢迎来到天天文库
浏览记录
ID:35724297
大小:1.53 MB
页数:14页
时间:2019-04-14
《论文--基于微博评论的情感分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于情感词典的微博评论情感分析理工学院计科一、实验题目基于微博评论的情感分析二、实验目的用Java实现对微博评论数据的分词和情感分析。得到评论的情感倾向是积极、消极还是中性以及情感倾向度。以此作为算法研究微博评论的基础。三、实验环境操作系统版本:WINDOWS7主要硬件:CPU,内存,显示器实验平台:JavaEclipse四、实验步骤1、Java环境配置先安装jdk选择【新建系统变量】--弹出“新建系统变量”对话框,在“变量名”文本框输入“JAVA_HOME”,在“变量值”文本框输入JDK的安装路径在“系统变量”选项区域中查看CLASSPATH变量在文本框起始位置添加“.;%JAVA_
2、HOME%libdt.jar;%JAVA_HOME%libtools.jar;”。在“系统变量”选项区域中查看PATH变量,在文本框起始位置添加“%JAVA_HOME%bin;%JAVA_HOME%jrebin;”2、验证环境变量是否配置成功:如果出现下面界面说明你已经配置好了!你的电脑就可以运行java程序了。3、导入目的文件点击finish导入完成,可运行程序。五、功能和代码实现功能实现:算法分为四个方面来实现,爬虫获取微博评论、分词、情感定位和情感聚合。通过算法可以实现对于微博评论的分词和人们的情感倾向分析。是积极消极还是中性的态度以及情感的倾向度。中文分词和去除停
3、用词测试文件得到情感倾向度情感定位微博评论爬虫情感聚合项目模块设计代码实现:本人在项目组中负责情感定位的部分和代码,本部分代码的主要功能是给不同情感词进行人工标记。具体代码如下:publicclasssentiment{SetposWordSet,negWordSet,negVodSet,vod1Set,vod2Set,vod3Set,vod4Set,vod5Set,vod6Set;//不同情感词的词库StringBuffersensTxt;floattolSens=0;//各个极性短语的强度floatdocSens=0;//句子平均的强度,inti=1;intw=1;
4、intq=1;publicstaticvoidmain(String[]args)throwsException{fengCijd=newfengCi("./DATA/tt.txt","./DATA/ttFC.txt","UTF8");jd.getFengci();//开始sentimentsentimenta=newsentiment();a.readDoc("./DATA/ttFC.txt","./DATA/ttPrediction.txt");}publicvoidreadDoc(Stringpath,StringsenPath)throwsIOException{Filedoc
5、=newFile(path);StringsigleDoc=null;String[]stringList;dic();StringBufferreadParse,ParseSen;BufferedReaderdocBf=newBufferedReader(newInputStreamReader(newFileInputStream(doc),"gb2312"));while((sigleDoc=docBf.readLine())!=null){readParse=newStringBuffer();ParseSen=newStringBuffer();readParse.appen
6、d("<");//后加7、8、negWordSet.contains(stringList[i])9、10、negVodSet.contains(stringList[i])11、12、vod1Set.contains(stringList[i])13、14、vod2Set.contai15、ns(stringList[i])16、17、vod3Set.contains(stringList[i])18、19、vod4Set.contains(stringList[i])20、21、vod5Set.contains(stringList[i])22、23、vod6Set.contains(stringList[i])){if(readParse.lastIndexOf(">")>readParse.lastIndexOf("<")){//输出>的位置,从0开始re
7、
8、negWordSet.contains(stringList[i])
9、
10、negVodSet.contains(stringList[i])
11、
12、vod1Set.contains(stringList[i])
13、
14、vod2Set.contai
15、ns(stringList[i])
16、
17、vod3Set.contains(stringList[i])
18、
19、vod4Set.contains(stringList[i])
20、
21、vod5Set.contains(stringList[i])
22、
23、vod6Set.contains(stringList[i])){if(readParse.lastIndexOf(">")>readParse.lastIndexOf("<")){//输出>的位置,从0开始re
此文档下载收益归作者所有