基于主题的科技政策分析系统设计与实现

基于主题的科技政策分析系统设计与实现

ID:35059742

大小:2.07 MB

页数:64页

时间:2019-03-17

基于主题的科技政策分析系统设计与实现_第1页
基于主题的科技政策分析系统设计与实现_第2页
基于主题的科技政策分析系统设计与实现_第3页
基于主题的科技政策分析系统设计与实现_第4页
基于主题的科技政策分析系统设计与实现_第5页
资源描述:

《基于主题的科技政策分析系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级:公开论文类型:应用研究工程硕士学位论文基于主题的科技政策分析系统设计与实现DesignandImplementationofScienceandTechnologyPolicyAnalysisSystemBasedonTopic培养单位:信息科学与技术学院专业领域:计算机技术学生姓名:李少博校内导师:邸书灵教授范通让教授校外导师:吴峰高工二〇一六年六月独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得石

2、家庄铁道大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:摘要科技政策是为了规范科技领域正常运转而制定的有计划、有组织的科技方针,体现了国家对于当前科技发展方向和产业规模的有效调控。随着科技政策文本的逐年增多,如何对科技政策文本进行有效的组织与管理,帮助政策研究人员快速获取其中的有价值信息,成为当前亟需解决的问题。本文以“河北省科技政策服务平台”实际项目为依托,针对该平台在处理大规模科技政策时存在的不足,将主题发现和文本聚类技术引入到科技政策文本处理中,利用

3、JavaWeb技术开发了科技政策分析系统,并将其集成在了河北省科技政策服务平台中。论文主要工作如下:(1)针对科技政策文本规模大、篇幅长的特点,采用LDA主题模型对政策文本进行建模,实现了将文本集合从高维的词空间映射到低维的主题空间,有效解决了在处理大规模数据时容易产生的文本表示空间高维稀疏的问题。(2)在发现科技政策集合中包含的隐藏主题后,抽取科技政策中自带的发布时间、实施范围信息,利用本文提出的主题强度计算方法,分析主题在不同的时间和地域条件下强度变化趋势。(3)提出了依据科技政策中包含主题的相似度大小,利用k-means算法实现对科技政策

4、的聚类操作,将科技政策集合划分为不同的类簇。针对k-means算法存在的不足,提出了基于社区发现的k-means改进算法,通过社区发现和社区中的中心节点选择方法,确定最优的聚类数量和初始聚类中心,并通过实验验证了所提出改进方法的有效性。(4)在理论研究的基础上,针对“河北省科技政策服务平台”项目中存在的新需求,将上述的主题分析以及文本聚类技术应用在中,设计开发了科技政策分析系统,实现了针对政策文本的自动分析与管理。最后,对全文做出总结指出不足,并对未来研究做了展望。关键词:科技政策;LDA模型;主题发现;文本聚类;社区发现AbstractSci

5、enceandtechnologypolicyisaplannedandorganizedguidelineofscienceandtechnologydesignedtostandardizescienceandtechnologyfieldworkingnormally,reflectingtheeffectivecontrolofthecurrentdirectionofthescienceandtechnologydevelopmentandindustrialscale.Withthescienceandtechnologypolic

6、ytextsincreasingyearbyyear,howtomanagescienceandtechnologypolicytextseffectiveandhelpresearchersobtainthevaluableinformationquicklyhasbecomeaproblemneedtosolvecurrent.Inthispaper,basedontheactualproject"HebeiprovinceScienceandTechnologyPolicyServicesPlatform",duetotheshortco

7、mingsofdealingwithlarge-scalescienceandtechnologypolicy,introducingtopicfoundandtextclusteringtechnologyintothescienceandtechnologypolicytextsprocessing,usingJavaWebtechnologytodevelopthescienceandtechnologypolicyanalysissystem,andintegratingitintotheplatform.Themainworkisas

8、follows:(1)Mostofscienceandtechnologypolicytextshavebigscaleandlonglength.A

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。