欢迎来到天天文库
浏览记录
ID:35102137
大小:4.41 MB
页数:60页
时间:2019-03-17
《面向新闻文本的商情挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、—’--左-―、—-■--’‘:一?—:—:心一_..?_。*'‘-,—-,.,-?.;.?.1.■二-、?二-马4吉.'_:.._;,_^'‘'::v;古请:t5扉i:貫妹钟I帶驚,皆觀夢囊麗霞誦腳養;li謹M議顏:;;■'-皆:罐舉講黨S瘍苗蠻苗議頭ss穀撰纖驶驚瓦-部\W珠纔靠V誦画iiiiiii矮話>IT麵乂薦余■'■...■■?-.--;V;'':.硕±■
2、学位论文"'-,,:;v''■V-'./__???....‘,,I,'心二V品护巧谭'.?..-..v.7?,‘:.?.S4'沦支题目面向新簡义本的商樽挖掘*''',■■"?^.:-:7Tr;..?:.i-、.'...V护把'/V訂诗请专业就費妍应規技术'■"■-町甘乃:.巧费方向知巧管理与臀龜人祝寒互-—k...一.
3、、.■..猎导蕃橄张桂平(教授)二零六年吉月,..'.'??-,:-???二;.--r;_原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下独立完成的。除文中己经注明引用的内容外,本论文不包含其他个人或集体己经发表或撰写过的作品或成果,也不包含本人为获得其他学位而使用过的成果。对本文研究做出重要贡献的个人或集体均己在论文中进行了说明并表示谢意。本声明的法律后果由本人承担。论文作者签名:兩2。乂
4、年^月/多日版权授权说明"本人授权学校有权保留送交学位论文的原件,允许学位论文被查飼和借阅,学校可公布学位论文的全部或部分内容,可K影"论文印、缩印或其他复制手段保存学位论文:愿意将本人学位电子版提交给研究生部指定授权单位收录和使用。学校必须严格按照授权对论文进行处理。,不得超越授权对毕业论文进行任意处置作者:75固指导教师兴和平。/>又/占年卖月/若日1化年^月曰分类号密级公开UDC学位论文题目:面向新闻文本的商情挖掘研究生姓名:万国学科专业名称:计算机应用技术研究方向:知
5、识管理与智能人机交互论文类型:应用研究申请学位:工学硕士指导教师姓名:张桂平指导教师职称:教授指导教师单位:沈阳航空航天大学论文提交日期:2016年03月07日论文答辩日期:2016年03月11日沈阳航空航天大学2016年03月SHENYANGAEROSPACEUNIVERSITYTHESISFORMASTER’SDEGREERESEARCHONBUSINESSINFORMATIONOFNEWSTEXTCandidate:GuoWanSupervisor:GuipingZhangSpecialty:Computer
6、ApplicationTechnologyDate:March,2016沈阳航空航天大学硕士学位论文摘要随着网络媒体的不断发展,各种消息媒介为人们了解世界提供了便捷的渠道。新闻文本作为众多媒介的一种有着其自身的优势,新闻文本中蕴含着大量的商务信息,若能快速有效的获取这些商务信息,无疑会对企业决策者计划的制定,企业对于市场动态的把控提供强有利的支持。中国工业淘堡网长期致力于商情挖掘的研究,针对企业、产品获取了大量与之相关的信息。本文对所获取的新闻做了进一步挖掘,主要包括新闻主题句抽取与新闻要素抽取这两方面。在新闻主题
7、句抽取方面,本文从新闻文本两大主要的特点即新闻标题能反映新闻的主旨及新闻的要点前置这两方面出发,运用句子的位置,句子标题重合度,句子标题关联度来度量文本中句子的重要程度。其中句子标题重合度考虑了标题句子重合词的个数以及重合词的重要程度这两方面的信息,标题句子关联度通过计算标题与句子的权值矩阵,运用加权二部图的最大匹配算法来计算得到的标题与文本中每一句话的关联度得分。最终运用加权的方式将特征进行组合,并通过得分排名进行主题句的抽取。最终实验显示,利用本文方法进行主题句抽取时,准确率为75.9%。在新闻要素抽取方面,本
8、文从得到的新闻主题句以及新闻的标题入手,运用了一种以who为驱动的新闻要素抽取方法,通过RankingSVM的方法来得到新闻主体who,再根据得到的who制定模式来获取新闻中其它的要素。根据实验结果显示该方法抽取出的新闻要素可以一定程度的反映新闻的主旨信息。最后设计实现了面向新闻文本的商情挖掘系统。该系统对新闻资源建立索引,可以根据用户需求挖掘出用户感兴趣的
此文档下载收益归作者所有