基于异构信息的异动事件发现

基于异构信息的异动事件发现

ID:33233740

大小:1.33 MB

页数:67页

时间:2019-02-22

基于异构信息的异动事件发现_第1页
基于异构信息的异动事件发现_第2页
基于异构信息的异动事件发现_第3页
基于异构信息的异动事件发现_第4页
基于异构信息的异动事件发现_第5页
资源描述:

《基于异构信息的异动事件发现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于异构信息的异动事件发现BURSTEVENTDETECTIONBASEDONHETEROGENEOUSINFORMATION相洋哈尔滨工业大学2011年12月国内图书分类号:TP391.3学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文基于异构信息的异动事件发现硕士研究生:相洋导师:王晓龙教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2011年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3UDC:621.3ThesisfortheMasterDegreeinEngineeri

2、ngBurstEventDetectionBasedonHeterogeneousInformationCandidate:XiangYangSupervisor:Prof.WangXiaolongAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:December,2011Degree-Conferring-Institution:HarbinInstituteofT

3、echnology哈尔滨工业大学工学硕士学位论文摘要随着因特网技术的不断发展,网络信息已经逐步成为人们学习、工作和生活中不可或缺的重要组成部分。网络提供了大量的文本信息,如新闻、博客、论坛、微博等。这些非结构化的数据提供给人们定性的信息,而在许多行业,这些信息还会同时作用于结构化数据。这个现象在金融领域尤为突出,由于金融股票领域的特殊性,我们需要同时把握市场中的结构化数据和非结构化数据中蕴含的信息,特别是非结构化的金融文本中体现的金融事件,它们可能会对结构化数据的变化产生重要的影响。为此,本文将综合金融股票领域的结构化和非结构化信息,以金融本体为基础,发现影响股票市场异动的金

4、融事件,并对这些事件加以归类整理。本文的主要研究内容包括以下几个方面:(1)异构信息的获取和预处理:包括每日异动股票结构化数据和非结构化网页数据的获取、预处理和异构信息关联;(2)金融事件的抽取:利用文本挖掘的方法从关联后的金融新闻文本中抽取金融事件;(3)事件金融本体的构建:建立一个以动词为核心,涵盖股票领域基本金融事件的领域本体;(4)基于金融本体的事件标注:利用建立的事件金融本体标注金融事件并加以归类。本文利用实时的股票数据与各大金融网站的金融新闻构建在线系统,并利用和讯金融网站2010年10月至2010年12月的上市公司新闻作为金融本体构建的训练语料,2011年1月至

5、2011年7月的公司新闻作为信息关联、事件抽取和本体标注的评测语料来进行实验。利用文本挖掘和本体标注的相关评测方法,事件抽取过程在准确率上达到78.06%,召回率上达到81.16%,F1值达到0.7958,本体标注准确率达到83.33%,基本满足在线应用系统的要求。关键词异构信息;金融本体;语义标注;文本聚类-I-哈尔滨工业大学工学硕士学位论文AbstractWiththecontinuousdevelopmentofcomputernetworktechniques,InternetInformationhasgraduallybecomeanindispensableco

6、mponentinpeople’sstudy,workandlife.Itprovidesalargequantityoftextmessagesuchasnews,blogs,BBSs,twittersandsoforth.Theseunstructureddataofferqualitativereferenceforuserswhiletheymayalsohaveeffectsonstructureddatainanumberoffields,especiallyinfinancialfield.Duetothecharacteristicsofthisfield,w

7、ehavetograspinformationfrombothstructuredandunstructureddataatthesametime,inparticulartoeventsimpliedinfinancialtextswhichmaybeofgreatimportancetothechangeofstructureddata.Thereupon,basedonthestructuredandunstructureddataoffinancialstockfields,usingfinan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。