欢迎来到天天文库
浏览记录
ID:35178955
大小:3.56 MB
页数:67页
时间:2019-03-20
《基于lda主题模型上市公司年报文本知识发现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、:-.:.很韦,r,.芯Vr与特户;?:.装'丐.;';.,.-速.:满;;f;.v.-V.心#.n"把襄:」/带苗攀v.;.某i寒.義.:f/.\f苗/蔽类.:.部.:,::潘-,.:謹貧鑄‘言-今r,'M.W0;.■'終作去一}.麵-中国地质北店:;栏;.稽?械禱V<.;聲1f"'壬衫义r%顷、学^j賓睾0婷';,;;.是A,、..;.爵,.扣八再嗔、-拿;.\P郑释f義‘刹暮、^.;f‘—-冷互;货V.誤卷;?.J.LD-朵£主J莫-t奇责.'山,..X,,.K3;巧年手I文M沾、食油v|.:,‘'、‘、-
2、‘‘/F/."’:^:,.^1.^.^扛,i舊A'>:%:^^;..^^:躬;為^苗^!蟲酱荐^&....啦.".;.,>参..‘’.焉雜.龟麵?专岸心,r:,^:裳.学1g若.眷;、.:产變..7研r四’V瞻麵,孝.彝专^織与准衫、?./.啼究方r^与总^:,累教*文姑崔甲种身'v:-趙:.;己,.^細.i與害*累V3.=,咕结.‘卽-薦梭.^川侣某.就讀部;呼-莫;尹r--/.,八'M声明本人声明所呈交的论文是我个人在指及取导师导下进行的研究工的研作得成果。尽我所知,除了文中特别加臥
3、标注和谢的地方外,论文中不包含其他究致人已经发表或撰写过的研成果,也不包含为获得中地质究国大学或其它教育机构…工作。的学位或证书而使巧过的与我同的志对本研材料同究所做任何贡献均的已在论文中作了明确的说明并表示了谢意。f's杰"签名:瓜日;期带可??关于论文使用授权的说明、了解国地质大学有留使用学位论文的规,目:本人完全中关保定P学校有权,论文被j保留送交论文的印和学校可ji公布论的全部复件允许查阅借阔;i文或部内,可采。分容用影印、缩印或其他复制手段保论文存\.^2^^(开□保密_年)(保密的论文在解密后应遵
4、守此规定)_签;::瓜带名导师篇名嗅期7条^?r.分类号密级中国地质大学(北京)硕士学位论文基于LDA主题模型上市公司年报文本知识发现学号:2007130024研究生:曹四华专业:管理科学与工程研究方向:信息管理与信息系统指导教师:林文副教授二〇一六年五月ADissertationSubmittedtoChinaUniversityofGeosciencesforMasterDegreeListingCorporationAnnualReportTextKnowledgeDiscoveryBasedonLDATopicModelMasterCandidate
5、:CaoSihuaMajor:ManagementScienceandEngineeringStudyOrientation:InformationmanagementandinformationsystemDissertationSupervisor:Prof.LinWenChinaUniversityofGeosciences(Beijing)摘要数据挖掘解决了从大量数据中发现有用信息的问题。对于一些文本、WEB页面、电子邮件等非结构化或半结构化的数据传统的数据挖掘算法难以处理。文本挖掘可以对多个不同的文档进行搜索排序、信息提取,信息过滤以及自然语言理解等,具有很好的
6、研究意义和商业价值。年报是投资者最容易得到的企业资料之一,它能够为投资者做出决策提供参考信息,是利益相关者了解各个公司的盈利能力、运营能力以及公司未来发展情况的一个很重要的途径。因此,上市公司年报的文本挖掘成为人们了解上市公司运营情况的重要手段。本文针对上市公司年报的文本挖掘方法及年报发现所呈现的企业发展趋势问题展开研究。研究参考LoughranandMcdonald(2011)提出的金融语义词库,对语义词进行了汉化调整,在此基础上建立了一种中文年报挖掘的语义词典。开发了基于语义词词典的年报文本信息分词处理程序,在此基础上构建了上市公司年报关键词LDA主题模型。研究发现,
7、通过分析年报中的语义关键词与年报中相关财务指标的关联关系,年报中不同语义的关键词与上市公司经营状况密切相关,肯定词与否定词会随着公司经营状况发生改变,而不确定性词的增加与未来公司的经营具有负相关关系,并采用多样本对研究结果进行了验证。关键词:文本挖掘,LDA,主题模型,年报文本信息1AbstractTheemergenceofDataMiningsolvestheproblemoffindingusefulinformationfromalargenumberofdata.TraditionalDataMiningalgori
此文档下载收益归作者所有