基于智能agent的生物信息检索系统设计与实现

基于智能agent的生物信息检索系统设计与实现

ID:34188226

大小:310.47 KB

页数:77页

时间:2019-03-04

基于智能agent的生物信息检索系统设计与实现_第1页
基于智能agent的生物信息检索系统设计与实现_第2页
基于智能agent的生物信息检索系统设计与实现_第3页
基于智能agent的生物信息检索系统设计与实现_第4页
基于智能agent的生物信息检索系统设计与实现_第5页
资源描述:

《基于智能agent的生物信息检索系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA工程硕士学位论文ENGINEERINGMASTERDISSERTATION论文题目:工程领域:指导教师:作者姓名:基于智能Agent的生物信息检索系统设计与实现软件工程朱清新教授刘兴萍班学号:200692320038分类号UDC注1密级学位论文基于智能Agent的生物信息检索系统设计与实现(题名和副题名)刘兴萍(作者姓名)指导教师姓名朱清新电子科技大学袁建新成高教都工授江西现代职业技术学院江(职务、职称、学位、单位名称及地址)西申请专

2、业学位级别硕士专业学位类别工程硕士工程领域名称软件工程提交论文日期学位授予单位和日期2009.3论文答辩日期电子科技大学2009.5答辩委员会主席评阅人2009年月注1:注明《国际十进分类法UDC》的类号日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月

3、日关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:年月日摘要摘要生物信息学是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。生物信息数据库中数据呈指数增长,如何有效组织、检索、处理出需要信息成为当前面临的挑战。在生物信息学领域,利用串联质谱搜

4、索数据库对肽和蛋白质鉴定是一个重要的生物序列检索问题。机器学习是使计算机能模拟或实现人类的学习行为,自动地通过学习获取新的知识和技能,并对已有的知识结构进行重新组织,不断改善性能,实现自我完善的一种新技术。度量数据库中保存的数据对象与用户查询之间相关度的检索函数是所有检索系统的关键组成部分。本文利用机器学习技术,从检索函数设计的两个方面,深入研究了生物信息学中蛋白质序列鉴定和蛋白质同源性预测这两个重要的检索问题。度量数据对象与查询之间相关性的基本指标会因实际检索问题的复杂性,往往有多种,构成多维特征向量。本文要研究的排位函数学习问题就是利用机器学习的方法将多种相关性

5、度量指标合理地合并成一个指标,即学习出一个定义在相关性特征向量上的实值函数,以对检索结果进行排位。数据的块结构形式是检索函数学习问题独有的特点。本文结合蛋白质同源性预测问题,通过深入挖掘这种块结构提出了一些提高检索函数学习准确性的方法,包括用于解决块间数据非独立同分布问题的块内数据归一化和块特征向量扩充方法;用于数据去冗余的块选择和支持向量下采样方法;以及用于构造查询适应的检索函数的K近块集成排位算法等。本文将软件Agent理论和数据挖掘技术相结合,设计了一个基于智能Agent的面向生物信息领域的信息检索服务系统。系统通过对用户访问网页的分析得到用户的兴趣特征,用户

6、可以从系统获取符合其爱好的信息,从而实现了个性化的信息服务。系统不仅可以根据用户喜好进行个性化信息过滤;还可以通过Agent之间的信息交换实现合作过滤。关键词:信息检索,生物信息学,串联质谱,机器学习,AgentIABSTRACTABSTRACTBioinformaticsisanewcomprehensivecrossdisciplineinvolvingbiology,computerscienceandapplicationmathematis.Thenumberofdocumentsonthethebiologicalinformationdat

7、abaseincreaseexponentially.Howtoorganize,retrievalandprocessthesegreatinformationbecomeabigchallenge.Intheinformationareaofbiology,peptideandproteinidentificationviatandemmassspectrometryanddatabaseretrievalisanimportantbiologicalsequenceretrievalproblem.TheMachine-learningisanewte

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。