欢迎来到天天文库
浏览记录
ID:53028540
大小:1.41 MB
页数:14页
时间:2020-04-14
《基于LDA主题模型和生命周期理论的科学文献主题挖掘-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、JOURNALOFTHECHINASOCIETYFORSCIENTI~’I【:情报学报ISSN1000—0135ANDTECHNICALINFORMA11ONISSN1000—0135第34卷第3期286—299,2015年3月Vo1.34No.3,286—299March2015doi:10.3772/j.issn.1000-0135.2015.003.007基于LDA主题模型和生命周期理论的科学文献主题挖掘’关鹏王日芬(1.南京理工大学经济管理学院,南京210094;2.巢湖学院数学系,合肥238000)摘要科学文献主题挖掘可以帮助科研人员
2、快速准确的捕捉学科主题的脉络结构,跟踪主题演化发展,并对学科发展趋势做出预测。本文将LDA(LatentDirichletAllocation,潜在狄利克雷分配)主题模型与科学文献生命周期理论结合起来,提出一种挖掘学科领域生命周期语义信息的方法。为了体现学科领域研究主题的动态语义信息,将科学文献按照时间特征划分,利用文献信息增长规律刻画学科领域生命周期,在此基础上,实现学科生命周期不同阶段、不同层次的主题抽取和主题演化。在由国内新能源领域的科学文献构成的语料库上的实验结果表明,该方法能够监测和追踪新能源研究热点和发展态势,能够为科学研究和科技政
3、策制定提供决策支持。关键词LDA生命周期理论主题抽取主题演化新能源TopicMininginScientificLiteratureBasedonLDATopicModelandLifeCycleTheoryGuanPeng'andWangYuefent1.SchoolofEconomicsandManagement.N8njingUniversityofScience&Technology,Nn啦tng2100942.DepartmentofMathematics,ChaohuUniversity,Hefei238000)AbstractSc
4、ientificliteraturetopicminingcouldhelpresearcherscatchsubjecttopiccontextstructure,tracktopicdevelopmentandmakeforecast.ThepapercombinesLDA(LatentDirichletAllocation)topicmodelandscientificliteraturelifecycletheory,topresentamethod,whichcouldminesemanticinformationofsubjecta
5、realifecycle.Inordertoreflectthedynamicsemanticinformationofsubjecttopic,thepaperdividesscientificliteraturesbytimecharacterfirstlyanddescribestheSUbjeetarealifecyclebyliteratureinformationgrowthrule.Onthisbasis,wecarryouttopicextractionandtopicevolutionindifferentstagesandl
6、evelsofsubjectlifecycle.Experimentalresultsonrealscientificliteraturecorpusindomesticnewenergyresearchfielddemonstratedthattheapproachproposedinthispapercouldmonitorandtrackresearchhotanddevelopmenttrendofnewenergy.So,itcouldprovidedecisionsupportforscientificresearchandscie
7、nceandtechnologypolicymaking.KeywordsLDA,lifecycletheory,topicextraction,topicevolution,newenergy究领域,科学技术文献的存储和获取发生了根本性1引言的变革。当科研人员搜索某一研究领域的科学技术文献时,至少可以获取如期刊论文、会议论文、科技随着数据库和Web技术的高速发展,在科学研报告、专利,甚至Web文本等不同形式的科学文献。收稿日期:2014年10月7日作者简介:关鹏,男,1983年生,南京理工大学经济管理学院博士研究生,主要研究方向:数据挖掘与知
8、识发现、知识工程与知识挖掘,E.mail:guanpengt983@163.cnm。王日芬,女,1963年生,管理学博士,南京理工大学经济管理学院教授
此文档下载收益归作者所有