跨语言专利分析方法研究.pdf

跨语言专利分析方法研究.pdf

ID:50154712

大小:6.35 MB

页数:163页

时间:2020-03-07

跨语言专利分析方法研究.pdf_第1页
跨语言专利分析方法研究.pdf_第2页
跨语言专利分析方法研究.pdf_第3页
跨语言专利分析方法研究.pdf_第4页
跨语言专利分析方法研究.pdf_第5页
资源描述:

《跨语言专利分析方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、跨语言专利分析方法研究刘胜奇2015年6月中图分类号:C931.9UDC分类号:005.94跨语言专利分析方法研究作者姓名刘胜奇学院名称管理与经济学院指导教师朱东华教授答辩委员会主席黄鲁成教授申请学位管理学博士学科专业管理科学与工程学位授予单位北京理工大学论文答辩日期2015年6月ResearchonMethodsofCross-languagePatentAnalysisCandidateName:LiuSheng-qiSchoolorDepartment:ManagementandEconomicsFacultyMentor:Prof.ZhuDo

2、ng-huaChair,ThesisCommittee:Prof.HuangLu-chengDegreeApplied:DoctorofManagementMajor:ManagementScienceandEngineeringDegreeby:BeijingInstituteofTechnologyTheDateofDefence:June,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获

3、得北京理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学博士学位论文摘要专利分析广泛应用于管理领域,已成为研究热点。单语言专利分析只分析一种语言的专利,处理多语言专利的质量不高。多语言专利处理的困难之处,源于多语言专利技术的四大特点:术语新、跨语言、跨领域、全球化。本文在现有专利分析、自然语言处理、可视化分析的基础上,针对专利技术的特点,开展跨语言专利分析方法研究,为解决多语言专利分析问题提供了新思路和新方法。本文主要创新成果如

4、下:(1)提出TValue跨语言专利术语抽取法,基于首尾词性规则进行词串抽取,通过词串的首尾词性度、词长度、独立度、停用度、重要度,计算五属性组合值TValue,识别TValue高于术语可信度的词串为获选术语。实验结果表明,该方法可有效地抽取低频术语、非名词术语,其质量高于同类方法。(2)提出HSI跨语言专利句子对齐法,通过句对的句长相关度、语义相关度、符号相似度、编号相似度,计算属性组合值SValue,识别同一文档中SValue较大的句对,获得1对1、1对0、0对1的句对齐,再通过句子合并、句子删除,获得多对1、1对多、多对多、多对0、0对多的句对

5、齐。实验结果表明,该方法可有效地处理有噪音的句子对齐,其质量好于同类方法。(3)提出AGiza/ALLR跨语言专利术语对齐法,识别首尾相关度大于0的共句术语对,通过语义相关度、首尾相关度、词性相关度、独立相关度、停用相关度、GIZA++计算的g值、共现相关度、长度相关度,分别计算AGiza/ALLR术语对齐度,术语对齐度大于术语对齐阈值的术语对为对齐术语对。实验结果表明,在各种召回率时,两种方法的准确率都好于GIZA++、Dice、Φ2、LLR、K-VEC及DKVEC。(4)提出CCT跨语言专利相似度分析法,通过同义术语识别、同义术语分析,构建跨语言

6、同义术语集,发现术语概念与对象共现关系,计算CCT相似度,基于CCT相似度构建跨语言网络图,基于跨语言网络图构建跨语言全球图、术语交叠图。实验结果表明,CCT跨语言专利相似度分析可对多语言专利进行有效分析。在中英文电池专利数据中,本文提出的上述方法得到了检验和验证研究,对科技管理、专利战略、文本挖掘、机器翻译、大数据管理等,具有参考作用和应用价值。关键词:跨语言;专利分析;术语抽取;句子对齐;术语对齐;相似度分析I北京理工大学博士学位论文AbstractPatentanalysishasbeenwidelyusedformanagementfield

7、.Patentanalysishasbeenahotresearchissue.Becausemonolingualpatentanalysisonlyanalysemonolingualpatents,ithaspoorqualityusingincaseofcross-languagepatents.Itisdifficulttoprocessmulti-languagepatentsforthefourcharacteristicsofmulti-languagepatenttechnology,suchasnewterms,cross-lan

8、guage,interdisciplinaryandglobalization.Inthisthesis,i

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。