基于slca的ietm信息片段检索技术研究

基于slca的ietm信息片段检索技术研究

ID:27489896

大小:2.96 MB

页数:75页

时间:2018-12-04

基于slca的ietm信息片段检索技术研究_第1页
基于slca的ietm信息片段检索技术研究_第2页
基于slca的ietm信息片段检索技术研究_第3页
基于slca的ietm信息片段检索技术研究_第4页
基于slca的ietm信息片段检索技术研究_第5页
资源描述:

《基于slca的ietm信息片段检索技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC:编号:工学硕士学位论文基于SLCA的IETM信息片段检索技术研究硕士研究生:崔木子指导教师:印桂生教授学科、专业:计算机软件与理论论文主审人:韩启龙副教授哈尔滨工程大学2013年3月分类号:密级:UDC:编号:工学硕士学位论文基于SLCA的IETM信息片段检索技术研究硕士研究生:崔木子指导教师:印桂生教授学位级别:工学硕士学科、专业:计算机软件与理论所在单位:计算机科学与技术学院论文提交日期:2013年1月论文答辩日期:2013年3月学位授予单位:哈尔滨工程大学ClassifiedI

2、ndex:U.D.C:ADissertationfortheDegreeofM.EngResearchofIETMInformationPiecesRetrievalTechnologyBasedontheSLCACandidate:CuiMuziSupervisor:Prof.YinGuiShengAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputersoftwareandtheoryDateofSubmission:January,

3、2013DateofOralExamination:March,2013University:HarbinEngineeringUniversity哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(

4、签字):日期:年月日哈尔滨工程大学学位论文授权使用声明本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。本论文(□在授予学位后

5、即可□在授予学位12个月后□解密后)由哈尔滨工程大学送交有关部门进行保存、汇编等。作者(签字):导师(签字):日期:年月日年月日基于SLCA的IETM信息片段检索技术研究摘要现阶段计算机信息化的迅速发展,一些大型的复杂武器装备已经不能使用纸型技术资料手册很好的来描述其信息。而交互式电子技术手册(InteractiveElectronicTechnicalManual,IETM)的出现很好地解决了这一问题,它取代了传统的纸型技术资料,而是将其转化为电子信息形式展示给用户,并且可以实现人机交互,更加方便管理和

6、维护。IETM的制作要有相应的标准来规范,S1000D是现在较流行的一种国际标准,它是由欧洲航空航天和国防工业协会及美国航空航天工业协会共同制订,它使用模块化的形式对IETM中的技术信息进行管理,增加了技术信息的共享性。和其他的系统一样,都具有信息检索功能。当用户在IETM环境中的时候,可以通过输入关键字,快速访问到对自己有用的信息。本文针对现有的IETM技术信息检索功能存在的不足,设计了一种基于最紧致片段问题(SmallestLowestCommonAncestor,SLCA)的IETM信息片段检索模型

7、。首先本文对国内和国外现存在的比较成熟的专业的IETM平台进行分析研究,发现目前的符合S1000D标准的IETM技术信息检索过程存在两个问题,分别是检索过程中需要扫描整个数据模块,降低检索效率;检索结果无法定位到具体的技术信息片段。针对以上问题,本文设计了基于SLCA的IETM信息片段检索模型。在本文设计的模型中引入了XML关键字检索中的最紧致片段的思想。在用户输入若干个关键字的情况下,将问题转化为求解多关键字的SLCA节点的问题。本文通过对现存在的SLCA常用求解算法的分析,对XML文档的Dewey编码

8、进行改进,设计了一种HS-D的编码方式,大大降低了编码长度。根据这一编码方式,提出了一种新的SLCA求解算法。为了使最终返回给用户的信息片段更精准、更有意义。在本文的模型中加入了元素提取模块,为不同的元素制定不同的提取规则。并且设计了技术信息简化模块,将对检索过程中无意义的元素和属性过滤掉,提高检索速率。在本文的最后,以一个描述类的数据模块为具体实例,演示了整个模型的具体工作流程,结果显示本文设计的模型可以快速、准确地返回给用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。