欢迎来到天天文库
浏览记录
ID:33789109
大小:2.41 MB
页数:68页
时间:2019-03-01
《基于语义的生物信息集成中的信息提取与查询技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东南大学硕士学位论文基于语义的生物信息集成中的信息提取与查询技术的研究姓名:郭太飞申请学位级别:硕士专业:计算机应用技术指导教师:何洁月20070310东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果·尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。研究生签名:鍪垄垒日期:伽7D
2、yfZ东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。研究生签名:巷2查堡导师签名:日期:东南大学硕士学位论文摘要鉴于开放的异构Web生物信息源数据量庞大,Web访问低效而易出错,检索接口不完善,难于查询和检索,Web页面结构化
3、程度低等问题,本文研究了基于语义网格的生物信息集成技术,从信息的查询、检索、提取和集成(数据源部分)四个方面入手,主要完成了如下一些工作:1)详细设计了基于语义网格的生物信息集成系统的数据适配层的系统框架。2)研究并实现了扩展现有Web数据源的检索能力以支持全面的数据查询的技术,主要包括查询解析、数据筛选和投影。虽然Web数据源提供的检索和访问方式各异,但本文提供了统一的访问方法:针对不同数据源良莠不齐的Web检索支持,本文提供了用户需要的查询能力。3)研究了逻辑Web访问、带混淆的线程池和数据库缓存的技术,并实现
4、了统一高效的Web检索和数据获取,提高了Web访问的速度,使得对Web数据源的大数据量查询成为可能。4)重点研究并实现了利用XPATH规则和文本上下文规则自动地从#eb页面中提取信息的技术,包括两种规则的规则执行模块和信息提取模块,以及文本上下文规则的词法和语法解析模块。同时,文本规则提供了一定的跟踪和调试能力帮助用户分析规则的执行过程.从而大大降低了编写和分析文本上下文规则的难度。5)研究了基于语义网格的信息集成以及网格服务封装技术,实现了基因调控数据源部分,并提供了各数据源的模式本体。关键词;语义网格、查询扩展
5、、Web检索、信息提取、信息集成奎塑查兰堡主兰垡鲨茎AbstractWiththehugeopenheterogenicWeb-basedbioinformaticsdatasources,loweffectandfragilewebaccesses,weakretrieveinterfaces,hard—to-usequeryandretrievemethods,lowstructuredWebpages,andotherdifficulties,theresearchonthetechnologiesofthe
6、Webbasedbioinformationintegrationonsemanticgridhasbeendoneinthisdissertation.Theworksincludedinformationquerying、retrieving、extractionandintegration(inthedatasourceiayer).ThemaincontributionsofthedissertationarelistedasfoIllows:1)Designedthedataadapterlayerarc
7、hitectureofbioinformationintegrationsystembasedOilthesemanticgrid.2)ResearchedonthetechnologiesforextendingtheexistingretrieveinterfacesofWebdatasourcestosupportfullquerycapability,suchasqueryparsing,datafilteringandprojection,andSOOil.Aunifyqueryinterfacewasp
8、roposedinthedissertationfordifferentdatasourceswh【ichhavedifferentretrieveandquerymethods.Althoughs∞edatasourcesbasedonWebonlyprovideaquiteweakretrieveinterface,thisdissertationpro
此文档下载收益归作者所有