欢迎来到天天文库
浏览记录
ID:35059065
大小:4.15 MB
页数:71页
时间:2019-03-17
《基于web信息抽取的网络舆情统计与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、-'?---'可-.;、I'.;节.二?、^.式\;V,:相V4单;/T;V7游;粟身校代码.八齋;穀努.聲;:万《脊#lf巧夺ft’,:'/诚‘节V敏端若乃冷《二、丰舊少7人名放’擎学鑽蔡慶钟藏丈學节方:’;:..;.硕±学位论文t;翻携;;:;^譜i/f.''..巧-..當:W^:,苗縣‘.:’、-在心..;'扭;;j掠基于Web信息抽取的网络舆情统计与分析/,;4輯'V.:成取伯—祀爲-.''话.jjrj:%.'?片J1V,V.?’’?'■?■?、..一、'‘;,,.V\V:'、
2、V-??j房為心1’:学号;Y13690006.;,;:击/己;輪,a纖!;女f娘y.:呼.J:学科专业;统计学;鴻邊巧、如作令尽知:研究方向;读:统计学习与预編务六7讀5。■'.■娘‘:■令,r尹..户?子气,户打疋VV常:.扣导师及职称:結胜教授的:;.知躬;满戶;承.户'-'乂、;20166..去7/论文答辩日期年月枯:.备y'授予学位日期:編年6月:户禱.耗夢剩P禱'f一‘户'..:>.....?.V..\;.掌V记八#.皆捉;立.?'^,V%呼.托發?聲;;作V.庆硕位评师范巧学员会办公古-:.
3、斋裝;就皆识為品皆;t句、??热..;;;珠鸿與髮麟泉郝謗乾k腳賢補安庆师范大学硕士学位论文基于Web信息抽取的网络舆情统计与分析StatisticsandAnalysisofOnlinePublicOpinionbasedonInformationExtractionfromWebpage作者姓名:黎康学号:Y13690006学科专业:统计学研究方向:统计学习与预测导师及职称:程玉胜教授论文答辩日期:2016年6月授予学位日期:2016年6月安庆师范大学学位评定委员会办公室基于Web信息抽取的网络舆情统计与分析黎康安庆师范大学硕士学位论文2016年5月26日(论文提交日期
4、)本论文经答辩委员会全体委员审查,确认符合安庆师范大学硕±学位论文质量要求。答辩委员会签名(姓名、职称、工作单位):主席;作;雜敵扳尉如足■委员:咱句喪^申辨矜备I护%辦巧‘心会也啼么、喻^备导师‘^;作不1独创性声明本人声明所呈的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加标往和致谢的地方夕h,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安庆师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说助并表示谢意。学位
5、论文作者签名:恭毛签字日期:W名年《月^日学位论文版权使用授权书本学位论文作者完全了解安庆师范大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和电子文件,允许论文被查阔和借阅。本人授权安庆师范大学可W将学位论文的全部或部分内容编入有关数据库进行检索,收录到《中国学位论、、文全文数据库》,可从采用影印缩印或扫描等复制手段保存汇编学位论文,向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)。学位论文作者签名:恭若指导教师签名:乎签字日期:击年/月《日签字日期;>(备年<月f日/摘要自19
6、94年中国正式接入Internet起,中国网民规模呈逐年持续快速增长的趋势。据2015年12月统计数据显示,中国网民已达6.88亿,超过半数的中国人已经开始使用互联网。互联网代替传统信息以纸质文字材料传播的形式,成为群众思想、文化、信息获取和交流的主要方式,又因为其传播速度快,波及范围广,参与人员多的特点,它也成为社会舆论的主要聚集地。大到震惊世界的朝鲜核问题、轰动全国的天津大爆炸事件,小到某明星参加奥斯卡颁奖典礼摔倒、某高校推出玉米炒提子菜系等,网络舆情的传播越来越牵动全社会人们的心。如何从数量庞大的网络信息中获取舆情信息,从而第一时间掌握舆情现状,预测舆情走势,及时正确引导舆情走向
7、,对社会健康稳定的发展具有非常重要的意义。本文的研究思路就是在这个背景下产生的,具体的研究内容如下:(1)首先对在本文研究过程中使用到的理论知识进行介绍,如Web信息抽取方法、文本表示方法,数据降维方法、聚类方法等。(2)针对网络信息(以新浪微博为例),主要是通过网络爬虫技术,大量爬取所需信息。本文采用的是企业开发并已投入使用的新闻爬取系统,该系统可以针对不同网页结构进行合适的DOM解析模板配置,从而方便快捷的进行数据爬取。(3)针对短文本的特
此文档下载收益归作者所有