微博自动分类方法研究及应用

微博自动分类方法研究及应用

ID:33061348

大小:972.65 KB

页数:58页

时间:2019-02-19

微博自动分类方法研究及应用_第1页
微博自动分类方法研究及应用_第2页
微博自动分类方法研究及应用_第3页
微博自动分类方法研究及应用_第4页
微博自动分类方法研究及应用_第5页
资源描述:

《微博自动分类方法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391.1学校代码:10213国际图书分类号:338.2密级:公开硕士学位论文微博自动分类方法研究及应用硕士研究生:江斌导师:芦鹏宇副教授申请学位:管理学硕士学科:管理科学与工程所在单位:经济与管理学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.1U.D.C:338.2DissertationfortheMasterDegreeinManagementTHERESEARCHANDAPPLICATIONONMICROBLOGAUTOMATEDCLASSIFICATION

2、Candidate:JiangBinSupervisor:A.P.LUPengyuAcademicDegreeAppliedfor:MasterofManagementSpecialty:ManagementScience&EngineeringAffiliation:SchoolofManagementDateofDefense:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学管理学硕士学位论文摘要微博是近几年兴起的一种网络交流与信息分享平

3、台,中国微博网民注册用户已经超过3亿,由于微博自身的传播性质以及信息内容产生的速度,每个用户都越来越需要应对信息泛滥的考验,同时每个用户微博主页上的信息杂乱无章,平台本身没有设置为微博进行自动分类的功能,使用户不能第一时间查看自己最关注的、最感兴趣的微博。本文将对微博文本进行分类研究,并在此基础上,结合微博用户兴趣对微博分类进行应用分析。首先通过对国内外文本分类领域的研究现状和研究成果进行分析,总结微博分类与文本分类两者之间异同点,并针对这些异同点进行对比分析,从而找出解决微博文本分类中存在问题的方法。然后通过对大量的微博数据进行观察分析

4、,归纳总结微博的类型、文本结构以及微博编辑的语言特点,并在此基础上对微博文本的相关要素进行定义及完成对微博数据模型的构建,接下来设计了微博数据的收集与存储策略,并最终确定微博文本的分词方法。其次通过分析四大门户网站内类别的分布情况,基于四大门户网站内的频道栏目信息以及新浪微博平台内的类别层次结构对微博文本的类别体系进行定义与说明,在此类别体系的基础上利用网页文本构建相应类别的类别特征模式库,并根据特征库内的结构及词汇特点,设计特征库调整算法用以剔除不同特征库内的重复词及不相关的词汇,以使每个特征库内包含的特征词与类别名称一致。最后通过提出

5、一种微博文本特征词与特征库内特征词相匹配的分类算法对微博进行自动类别标识,利用微博数据来验证分类算法的有效性和可行性,并在分类算法的基础上结合用户使用微博的兴趣来对微博分类进行应用性研究。本文的研究成果将会为用户创造巨大的应用价值,并会促使微博平台背后的企业积极地更新技术手段以更好的服务用户和社会。关键词:微博用户兴趣;微博分类;特征模式库-I-哈尔滨工业大学管理学硕士学位论文ABSTRACTMicrobloggingisanewnetworkcommunicationandinformation-sharingplatforminrec

6、entyears,theregisteredusers’snumberofthemicroblogginginChinahasbeenmorethan300million,duetothenatureofthespreadwayofmicrobloggingandthespeedofinformationcontentcreated,eachuserhastodealwiththetestofoverloadinginformation,andtheinformationforeachuseronthehomepageofmicroblo

7、ggingischaotic,thereisnofunctionofautomatedclassificationforplatformitself,sothatuserscannotviewthemostconcernedandinterestedmicrobloginformationatthefirsttime.Thispaperwillstudyonthemicrobloggingtextclassification,andonthisbasis,wewillanalyzetheclassificationapplicationc

8、ombinedwiththemicrobloggingusers’interest.First,thispaperanalyzedtheresearchresultsofdomesticand

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。