基于语义科技项目相似度计算的研究

基于语义科技项目相似度计算的研究

ID:34114360

大小:1.41 MB

页数:58页

时间:2019-03-03

基于语义科技项目相似度计算的研究_第1页
基于语义科技项目相似度计算的研究_第2页
基于语义科技项目相似度计算的研究_第3页
基于语义科技项目相似度计算的研究_第4页
基于语义科技项目相似度计算的研究_第5页
资源描述:

《基于语义科技项目相似度计算的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、杭州电子科技大学硕士学位论文基于语义的科技项目相似度计算研究研究生:罗灏指导教师:徐小良教授2012年12月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterSemantic-BasedResearchonSimilarityComputingofTechnologyprojectCandidate:LuoHaoSupervisor:Prof.XuXiaoliangDecember,2012杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导

2、下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用

3、影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日杭州电子科技大学硕士学位论文摘要随着我国科技计划项目申报数量和经费的逐年递增,项目重复申报现象日益突出,人工形式审查难以有效解决项目查重问题。论文针对科技项目申请书的特征,主要研究项目申请书关键词提取、知识表示模型构建以及基于内容项的语义相似度计算方法,并实现科技项目相似性检测分析系统,从而为科技项目查重提供自动的、高效的、公正的决策支持。论文主要研究工作包括:1科技项目分词及未登录词识别算法研究。针对科技项目申请书特征,提出一种基于字符串匹配及语义相结合的分词方法

4、;同时提出一种改进的互信息语言统计模型来识别未登录词。2科技项目关键词提取算法研究。利用《知网》知识结构计算词语之间的语义相似度,然后依据社会网络理论构建词语语义相似度网络并通过计算词语关联度来提取关键词,最后与提取的未登录词合并构成项目的所有关键词。3科技项目知识表示模型研究。通过研究分析向量空间及物元模型,对它们进行结合与扩展来构建项目知识表示模型及相应的知识索引库。4研究提出一种基于项目申请书内容项的语义相似度计算方法。该方法以项目名称、主要研究内容、技术指标等内容项作为相似度计算单元,分别计算项目内容项之间的语义相似度,然后对相似度进行加权平均求得项目相似度。基于上述研究

5、成果实现的科技项目相似性检测分析系统已应用于浙江省科技计划项目申报管理系统中。应用表明系统能有效检测出相似项目,验证了论文研究成果的可行性,为解决科技项目查重提供了良好的信息化平台。关键词:科技项目,关键词提取,语义相似度网络,相似度计算I杭州电子科技大学硕士学位论文ABSTRACTWiththeincreasingofthenumberandfundsoftechnologyprojectsdeclarationannually,repeateddeclarationshavebecomeincreasinglyprominent,whichbringdifficultytos

6、olveduplicationcheckproblemeffectivelythroughartificialform.Thispapermainlystudieskeywordsextraction,knowledgemodelconstructionandasemanticsimilaritycomputationmethodbasedontechnologyproject’scontentitemsforscienceandtechnologyprojectapplications,anddevelopsasimilaritydetectionandanalysissyst

7、emthatcanprovideautomatic,efficientandfairdecisionsupport.Themajorresearchisasfollows:Firstly,researchonChinesewordsegmentationandunknownwordsrecognitionalgorithmoftechnologyproject.Aimingatthecharacteristicsoftechnologyprojectapplication,the

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。