基于lda模型和分类号的专利技术演化研究

基于lda模型和分类号的专利技术演化研究

ID:28093056

大小:60.12 KB

页数:4页

时间:2018-12-08

基于lda模型和分类号的专利技术演化研究_第1页
基于lda模型和分类号的专利技术演化研究_第2页
基于lda模型和分类号的专利技术演化研究_第3页
基于lda模型和分类号的专利技术演化研究_第4页
资源描述:

《基于lda模型和分类号的专利技术演化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于LDA模型和分类号的专利技术演化研究〔摘要)[目的/意义]运用概率主题模型全面研究专利文献主题演化,分析专利技术发展过程及趋势。[方法/过程]LDA模型按时间窗口对专利文本建模,困惑度确定最优主题数,按专利文本结构特性提取主题向量,采用JS散度度量主题之间的关联,引入IPC分类号度量技术主题强度,最后实现主题强度、主题内容和技术主题强度3方面的演化研究。[结果/结论]实验结果表明:该方法能够深入挖掘专利文献的主题,可以较好地分析专利技术随时间的演化规律,帮助相关从业人员了解专利技术的演化过程及趋势。

2、〔关键词)专利文献;LDA;JS散度;IPC分类号;技术主题强度;专利技术演化DOI:10.3969/j.issn.l008-0821.2017.05.003〔中图分类号)G25553〔文献标识码)A〔文章编号)1008-082105-0013-06ResearchonPatentTechnologyEvolutionBasedonLDAModelandClassificationNumberLiaoLiefaLeFugang〔Abstract)[Purpose/significance]Thispap

3、erusedtheprobabilitytopicmodeltostudytheevolutionofpatentliterature,andanalyzedthedevelopmentprocessandtrendofpatenttechnology.[Methods/process]TheLDAmodelmodeledthepatenttextbytimewindow,confusiondegreemethodwasusedtodeterminedtheoptimalnumberoftopics,e

4、xtractingtopicvectorsaccordingtothestructuralcharacteristicsofpatenttext,usedtheJSdivergencetomeasuretheassociationbetweentopics,introducedIPCclassificationnumbertomeasuretechnicaltopicstrength,finally,theevolutionoftopicstrength,topiccontentandtechnical

5、topicstrengthwerestudied.[Results/conclusionjTheexperimentalresultsshowedthatthismethodcoulddeeplyexcavatethetopicofthepatentliterature,andcouldanalyzetheevolutionofpatenttechnologyovertimeandhelpthepractitionerstounderstandtheevolutionprocessandtrendofp

6、atenttechnology.〔Keywords〕patentliterature;LDA;JSdivergence;IPCclassificationnumber;technicaltopicstrength;patenttechnologyevolution令@令文献是技术情报的载体,它的文本中隐藏了大量的技术情报信息,是技术情报的最佳情报来源。从2011-2016年我国专利申请数量已经连续5年蝉联全球专利申请量之首,因此,从海量的专利文献中挖掘专利发展趋势具有重要的研究意义。专利技术演化分析是专

7、利文本分析的重要研宄方法。技术演化分析是指技术变化过程的发现和描述,进而进行技术发展趋势预测等内容。全面、深入和准确地分析技术发展情况,可以帮助国家制定科学技术发展规划,帮助企业了解市场发展动态和制定正确的市场技术路线,还可以帮助科研人员从技术的发展趋势中获得启发与借鉴。本文针对专利文本结构特点[1],提出基于LDA和分类号的专利技术演化模型。首先该方法在文本建模时,考虑专利文本内容的权重差异;其次结合专利文本权重提取专利文档的主题概率分布,然后在文本演化分析中,分析主题的主题强度和主题内容演化,及结合

8、专利的IPC分类号分析技术主题强度。最后实验表明,该模型能够较好地分析出专利文本的主题强度、主题内容演化和技术主题强度演化过程及趋势。1相关研究因专利技术演化分析能够探索和挖掘专利文本中的一些潜藏信息[2-4],故已成为该领域对特定技术发展研究的重要手段,国内外研究者对专利技术演化做了大量的研宄工作[5-9]。根据技术演化分析方法中利用专利文献中的不同信息,可以将专利技术演化分析方法分为3类。11基于专利分类号的技术演化专利分类号是对专利技

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。