欢迎来到天天文库
浏览记录
ID:37089611
大小:3.83 MB
页数:92页
时间:2019-05-17
《基于文本情感的微博舆情分析系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391学校代码:10697密级:公开学号:201531488_55士专业字位i2文DissertationfortheProfessionalDegreeofMaster基于文本情感的微博舆情分析系统设计与实现?工学科名称.软件程工专业学位类别:程硕士作者::杨康指导老师高岭教授西北大学学位评定委员会二〇一八年六月DesignandImplementationofPublicOpinionAnalysisSystemforWeiboBasedonTextualEmotionAthesissu
2、bmittedtoNorthwestUniversityinpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareEngineeringByYangKangSupervisor:GaoLingProfessorJune2018摘要随着社交网络的高速发展,社交平台已成为舆情事件发生、发展与演化的重要阵地。因此,面向社交平台分析网络舆情发展趋势,挖掘舆情背后的深层规律,一方面能帮助管理者分析用户偏好、掌握用户需求,提高服务的个性化程度与用户体验;另一方面,能够客观反映社会舆论导向,系统全面的体现网
3、民的社会价值观,帮助决策者提升应对突发事件的处置能力。针对现有网络舆情分析系统存在的舆情数据采集困难及分析方法单一等问题。本文重新设计了一种高效的数据爬虫,并结合多种基于文本的情感分析方法,以及传播学中的网络舆情分析方法,研发了一套面向微博平台的网络舆情分析系统。通过构建该系统能够实现微博平台舆情动态快速的呈现,能够有效提高监测和掌握目标舆情发展趋势的时效性和便捷性。具体工作主要包含以下几个方面:1.在系统实现层面,设计并开发了基于微博平台的网络舆情分析系统。该系统主要包括数据采集层、数据存储层、业务逻辑层、服务层和表现层共五层结构。其中包含舆情信息的采集与存储,业务
4、功能的设计与实现完整流程。较之于传统的舆情分析系统,本系统的结构化程度更高,功能划分更加细致、明确。2.在系统数据采集层,设计研发了一种新型的分布式网络爬虫,用于收集用户在新浪微博上所产生的舆论数据。通过对传统爬虫从分布式设计、下载器与解析器交互策略、网页解析模式等方面进行改进,改善了以往爬虫存在的爬取数据信息不完整、结构不清晰和时效性差等诸多问题;3.在系统业务逻辑层,研究并使用了TF-IDF算法、基于情感词典的情感极性判断方法、基于朴素贝叶斯的情感分析方法等,对用户发布的舆论文本进行了关键词抽取、情感极性分析、文本聚类,并在此基础上实现了用户观点挖掘、微博热点舆论
5、发现和目标舆情预警等功能;4.在系统保障层面,从单元测试、集成测试、系统测试三个层面对系统功能实现进行检测;使用响应事件、资源使用率、点击数等四个指标对系统性能进行了评价,验证了系统功能完整性和有效性,保证了系统的高效率和稳定性。关键词:网络舆情,文本情感,网络爬虫,特征提取IABSTRACTWiththerapiddevelopmentofsocialnetworks,socialplatformshavebecomeanimportantplacefortheoccurrence,developmentandevolutionofpublicsentiments.
6、Therefore,analyzingthetrendofonlinepublicopinionforsocialplatformsandminingthepublicopiniondeepbehindcanhelpmanagersanalyzeusers'preferences,graspuserneedsandenhancetheuserexperienceofpersonalizationservices.Ontheotherside,itcanobjectivelyreflectthetruthofthesocietythatguidedbypublicopi
7、nion.Oursystemfullyreflectsthesocialvaluesofnetizensandhelpsdecision-makersimprovetheirabilitytodealwithemergencies.Aimingattheexistingonlinepublicopinionanalysissystem,thereareproblemssuchashardingatheringpublicopiniondataandanalysismethodtoosingle.Thisarticleredesignedaneffic
此文档下载收益归作者所有