欢迎来到天天文库
浏览记录
ID:31778708
大小:80.34 KB
页数:11页
时间:2019-01-18
《基于双语词典和歧义消解的中英双语专利信息检索研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于双语词典和歧义消解的中英双语专利信息检索研究颜端武任婷陶志恒南京理工大学经济管理学院信息管理系摘要:[目的/意义]为了增进知识交流、知识共享,避免专利侵权,本文研究了基于双语词典和歧义消解的中英双语专利信息检索方案,并将其应用到实际系统开发中。[方法/过程]该方案通过基于双语词典的提问式翻译实现双语专利检索,利用基于潜语义分析的提问式消歧策略进行歧义消解,结合布尔检索模型与向量空间模型构建检索表达式,与专利索引库进行匹配,生成检索结果。[结果/结论]选取“3D打印”领域屮英双语专利语料为样本,通过检索实验证明方案的有效性。关键
2、词:专利信息;信息检索;双语词典;歧义消解;作者简介:颜端武,男,1976年生,博士,副教授。作者简介:任婷,女,1995年生,硕士生。作者简介:陶志恒,男,1992年生,硕士生。基金:江苏省社会科学基金项目“领域知识分析视角下文献知识关联揭示及应用研究”(项目编号:17TQB009)ResearchonChinese-EnglishBilingualPatentInfornmtionRetrievalBasedonBilingualDietionaryandDisambiguationAbstract:[Purpose/sign
3、ificance]Inordertoenhanceknowledgecommunicationandknowledgesharing,aswellastoavoidpatentinfringement,thispaperstudiestheChinese-Englishbilingualpatentinformationretrievalschemebasedonbilingualdictionaryanddisambiguetion,andappliesittodevelopsystcms.[Mcthod/proccss]The
4、paperusesthemethodofquerytranslationbasedonbilingualdictionarytoachieveretrieval,resolvesambiguitybasedonlatentsemanticanalysisofdisambiguationstrategy,andcombineswithbooleanretrievalmodelandvectorspacemodeltobuildretrievalexpress!on.Thenthepapermatchesthepatentindexd
5、atabasetogencratetheretrievalresults.[Result/conclusion]TheChinese-Englishbilingualpatentcorpusinthefieldof"3Dprinting〃ischosenasthesample,whichprovestheeffectivenessoftheschemebysearchingexperiment.Keyword:patentinfooiation;infonuationretrieval;bilingualdictionary;di
6、sambiguation;研究外国专利文献,一方面可增进知识交流,了解外国科研成果与技术的发展动态,避免专利侵权;另一方面可在知识共享的基础上加以创新,进而推动科学研究和技术创新发展。但是地域语言障碍和专利文献中夹杂的人量专业领域术语,严重阻碍了人们对外国专利文献的知识获取,而双语信息检索为此提供了一条有效可行的技术途径。它能使用户由“源语言”检索出“目标语言”信息资源,在一定程度上帮助和解决跨语言专利资源检索的语言障碍问题与专利挖掘分析问题,可为跨语言专利资源的获取和利用等提供借鉴和参考。1双语信息检索相关研究基础双语检索主要利
7、用不同语种间的处理技术构建双语对应关系来匹配源语种和目标语种,然后进行单语言检索。综合考虑双语检索实现效率和难易程度,提问式翻译现己成为跨语言检索的主流技术之一。由于提问式翻译检索结果育•接受查询翻译效果的影响,目前的研究集屮于查询翻译方法的研究。1)基于机器翻译的方法。机器翻译包括基于规则的、基于统计的方法山,Abu等図将基于规则的新型机器翻译方法应用于英语一阿拉伯语机器翻译系统中,较好地解决了一致性和词汇重排列问题,且具备较强的扩展性;何彦青等固分别采用规则翻译和统计翻译来提高双语术语对齐效果。机器翻译基于计算语言学等原理,其
8、局限性在于汉语语法、句法等的不规则性使翻译质量良莠不齐,并口当检索式短时,翻译容易出现歧义问题。2)基于双语词典的方法。利用双语词典,将用户提交的提问式翻译成一个或一组目标语言的检索词,再进行单语言检索。目前该方法主要在于改进翻译后产生的一对多歧义
此文档下载收益归作者所有