基于语义互联网医院评论文本情感探析及应用

基于语义互联网医院评论文本情感探析及应用

ID:16310676

大小:36.00 KB

页数:13页

时间:2018-08-09

基于语义互联网医院评论文本情感探析及应用_第1页
基于语义互联网医院评论文本情感探析及应用_第2页
基于语义互联网医院评论文本情感探析及应用_第3页
基于语义互联网医院评论文本情感探析及应用_第4页
基于语义互联网医院评论文本情感探析及应用_第5页
资源描述:

《基于语义互联网医院评论文本情感探析及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于语义互联网医院评论文本情感探析及应用  摘要:基于如何能够更好地利用互联网医院的评论信息,使其能够有利于指导医院改�M提高,让人们能够更好地了解以往患者就诊的情况,同时探讨更好的提升文本情感分析效果的方法。该文首先使用python爬虫爬取乌镇互联网医院的评论信息,其次在hownet词典的基础上,构建新的情感词典、否定词典、程度副词词典以及连词词典,构建了相应的情感分析规则。同时,根据评论信息分词后的词频数据运用R语言进行数据的可视化分析。得出使用情感词典和语义规则对互联网医院评论信息进行分析是有效的结论,同时指出了评论者关注点主要在态度、效果、耐心、治疗、预约、病人

2、、时间等方面上关键词:互联网医院;文本分析;情感分析;情感词典;语义规则中图分类号:TP18文献标识码:A文章编号:1009-3044(2017)03-0180-0413随着我国互联网的高速发展,越来越多的传统业务借助互联网实现业务的转型升级。加上我国医疗改革的呼声日益高涨,互联网医院开始悄然兴起。互联网医院是代表医疗行业发展的新方向,它对解决我国现在医疗资源严重不平衡以及人们日益增加的医疗资源的需求之间的矛盾具有巨大的推动作用,是目前我国卫生部门积极引导及推动的医疗发展新模式[1]互联网医院除了将传统的挂号、疾病咨询、处方等流程搬到互联网上[2],还为患者或患者家属提

3、供了向互联网医院传达医院服务水平、表达自己在医院服务感受的平台,即面向大众的互联网评论。患者及患者家属可以通过平台对互联网医院的服务环节、具体环境、资源分配等各个方面发表自己的看法,一方面向医院传递医院值得肯定的地方及医院需要改进的环节等信息,从而提升患者的体验,另一方面给想要了解互联网医院服务状况的患者及患者家属提供了良好的信息通道。由于互联网医院评论数量非常多,而且多为一百字以内的语句级短文本,如何能够快速准确地从这些语句级评论中分析出评论者的关注点以及对互联网医院的服务的正负向评价从而给医院的改进提供方向,成为了亟须解决的研究课题1相关研究情况13本文是对互联网医

4、院评论的文本信息进行分析和研究,根据评论信息判定其情感的倾向性及关注点内容。就文本情感分析而言,目前学术界已经有许多专家和学者研究如何快速高效的进行情感的倾向分类。根据是否训练学习可以将情感分类的方法分为基于语义规则的情感分类和基于机器学习的情感分类[3]。根据文本的处理粒度的大小不同,则可以将文本情感分类分为篇章级分类、语句级分类、词语级分类[4]。本文采用的是基于情感词典与语义规则的语句级分类方法进行分类13对于基于情感词典与语义规则方面的研究,徐琳宏、林鸿飞等通过计算待分类文本词汇与知网中已标注词汇之间的相似度,选取倾向性明显的词汇作为特征词,采用SVM及语义规则

5、相结合的方法,提高对文本褒贬的识别强度[5]。赵鹏、赵志伟等提出了基于语义的TriPos模式的分类方法,将统计分析与语义分析相结合,提高了主客观分析的准确率、召回率和F值,取得了良好的效果[6]。吴江、唐常杰等通过Apriori方法对金融文本属性进行抽取,然后使用语义规则的分析方法对web金融文本进行情感分析[7],取得的结果优于ku[8]的算法结果。杨立公、樊孝忠等提出了最大限度地综合利用各种语言的词典信息,对候选词进行情感语义归类,适用于没有其他知识背景的情况,具有一定的实用价值[9]。王志涛、於志文等根据微博的特性,对微博的不同语言层次制定不同的语义规则,结合微博

6、文本的粒度和表情符号,对微博文本进行情感分类,并验证了该方法的有效性[10]。赵天奇、姚海鹏等则通过把微博表情引入情感加权的方式,使得微博情感分类有了一定程度的提高[11]。陈国兰在已经标注的微博语料的基础上,构建包括程度副词、关系连词、否定词的词典,使用SVM分类,取得了较好的效果[12]。杨佳能、阳爱民构建了表情符号词典和网络用语词典,并使用依存句法分析构建情感表达树,并制定语义分析规则计算微博文本情感强度进行情感分类,证明了加入表情符号和网络用语有助于情感分类[13]2评论文本的获取与处理2.1评论文本的获取本文是选取乌镇互联网医院(挂号网)中的复旦大学附属中山医

7、院的患者的评论信息作为研究对象进行文本情感分析。作者通过借助Python爬虫完成挂号网账号的登录、验证码的识别、评论信息的下载等任务,共获取4315条评论信息2.2评论信息的预处理1)由于评论信息中存在同一个评论者连续评论多次,且每次评论的内容都相同的情况,所以需要对多余的评论信息进行删除处理2)对评论信息进行中文分词处理。目前分词工具比较多,使用较多的有jieba分词、中科大的NLPIR系统分词、庖丁解牛分词等等,本文使用中科大的NLPIR系统进行分词。该分词方法在分词、词性标注等方面取得较好的效果,同时方便添加词典3相关词典的构建13

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。