欢迎来到天天文库
浏览记录
ID:35070443
大小:4.69 MB
页数:51页
时间:2019-03-17
《基于语境分析的微博热点话题检测研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、采(巧尉您义聲NGX^JIAIUNIVERSITYOFFINANCE&ECONOMICS中图分类号UDC硕±学位论文MASTE民DISSERTATION基于语境分析的微博热点话题检测研究巧A论文题目忡文)ResearchonM-icroblogHotTopicDetectionBased论文题目--(英文)OnCoMextAnalsisy作者胥亚伟导师陈辉副教授与通信工程学院申请学位控养单位软件软件工程数据挖掘学科专业
2、研究方向二〇—六六月年独创性声明本人声明所呈交的论文是我个人在导师指导下进行巧研究工作及取得巧研究成果.尽巧巧知,除了文中特别加W标注和致谢的地方外,,论文中不包含其他人己经发表或撰写的研究成果1也不包含为获待狂西巧经大学或其他教育机构的学位或证书所使用过的椅料一.与我同工作的罔志对本研究所做的任何巧献靖;己在论文中作了明确巧说明并表示了谢患.签名;关于论文使用授权的说奶…本人完全了解狂西巧经大学有关保留、使用学位论文巧规定,巧:学校有权保留送交论文的复巧件,允许论文披査巧和借巧^采
3、用巧巧、巧印;学较可批么布论文的全部或部分内容,可^^歲其他复制手段保存论文?一(保密的论文在解密后遵守此规定)〉《奪.签名曰期:>4.n:导师签名;恃1目录1绪论11.1研究背景及意义11.1.1研巧背景11..12研究意义21.2国内外研究现状31.3本文的研究内容51.4论文的组织架构62相关技术及赛法介绍72.1微博信息获取及预处理72.1.1微博数据采集7么1.2微博信息抽取8么13中文分词8么1.4文本表示方法10么1.5相似
4、度计算12么2聚类方法14么么1基于层次的聚类算法15么么2基于划分的聚类算法15么么3基于密度的聚类算法16*么2.4anglePass算法16么3本章小结173微博预处理及话题聚类193.1微博短文本预处理193.11去噪生词19:3.1.2特征拓展20320.13改进的VSM模型3.2微博热点话题检测23>3.么1改进的SngleF^+算法巧3.么2热点话题特征243.么3热度评估模型25克3本章小结284实验结果分析29
5、4.1聚类算法评价参数294a.2权值系数的确定294.3聚类结果分析3043^.1SinlRa.经典ess31g算法结果■*M4SilR.3.2ngeas&算法结果334.4热点话题的发现354.5本章小结365总结与展望375.1本文总结375.2工作展望37参考文献说致谢43IIContents11Introduction1BackroundandSinificance1.1gg1.11.1Background2
6、1.1.2inificanceSg31.2CurrentResearch1Stud5.3TheContentofT村sy1.4tionalStructure6Organiza2RelatedTechnologyandAlorithmIntroduction7gr2.1AisitionandPerocessin7Informalon巧upg21DataAcuisition7.1.q2.1tion7.21nformaionExtract\todt8
7、2.loofChineseVrSeenation.13Technogygm2.110-4TextRepresent油on么1.5amilarityCalcul油on12Th么2Clustereory巧么么ical幻tinAlorithm141BasedonHierarchuserggt12.BPartitioninClusterinAlorihm4.22asedonggg-15么么3DensibasedClusteringMethodty-2.2
8、.4Srihm15iglePassAlgort172.3ChapterSummary193ShortTextPreprocessingandToi
此文档下载收益归作者所有