欢迎来到天天文库
浏览记录
ID:50046065
大小:5.16 MB
页数:57页
时间:2020-03-04
《基于卷积神经网络的序列特异性预测研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP181密级公开UDC编号《余A聲硕女研《4《隹儉戈题目某子卷巧袖经网络的巧列特异性预规研巧TitleResearchofsequencespecificitiesBasedOnConvolu村onalNeuralNetwork学院(所、中心)信息学隨专业名称计义机系统结构研巧生姓名巧航惜学号12013Q01Q43导师姓名姚绍义职称教投2016年3月论文独创性声明及使用授权本论文是作者在导师指导下取得的研巧成果。除了
2、文中特别加W标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研巧成果,不存在割窃或抄袭行为一。与作者同工作的同志对本研巧所做的任何贡献均己在论文中作了明确的说明并表示了谢意。:学校有权保留本论文(含电子版)现就论文的使用对云南大学授权如下,也可W采用影印、缩印或其他复制手段保存论文;学校有权公布论文的全部或部■分内容,可将论文用于査阅或借阅服务:学校有权向有关机构送交学位论文用、于学术规范串查社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。(内部
3、或保密的论文在解密后应遵循此规定)研巧生签名;旅據修.导师游名日期:拍要基因序列特异性的预测无论是在基因分析领域还是基因调控领域都扮演着重要作色,DNA和RNA结合蛋白的特异性模式序列对致病基因的发现也具有指导性作用。然而随着分子生物学的发展,生物数据量呈现爆炸式増长,通过生物实验和统计分析来寻找序列特异性的传统方法已经很难从海量数据中挖掘出有用数据,且时间和人力成本也太髙。卷积神经网络是近几年新兴的一种深度学习技术,目前在图像、语音识别及。-自然语言处理领域应用较广,发
4、展较成熟这种技术基于多层感知机(multilayerperceptron),多层感知机是上个世纪八十年代由Rumelhart、Williams、Hinton和LeCun等人共同提出的,其目标是通过模拟人脑神经元的信息处理过程,用神经一元网络来描述现实世界中的复杂规则般是函数形式。但多层感知机结构过于()简单一,导致描述事物或者规则的能力有限。针对这问题,人工智能专家们经过不撫努力,不断増加神经网络的深度,同时将不同层划分为不同功能,从而催生出了卷积神经网络。本文主要关注点是模体识别问题中模体
5、的序列特异性,针对这个问题,使用。卷积神经网络建立了相应的序列预测模型该模型主要涉及几个阶段:首先将字符串序列转化为数值编码矩阵,再用预测模式的数值矩阵对序列编码矩阵进行卷一积运算,从而自动从序列中提取预测模式的特征,卷积输出的矩阵中每个元素一需要与给定的闲值相减,只保留结果大于0的元素传入下层:再将经过闽值矫ool,正过的输出矩阵输入池化in,池化层的作用是对输入数据进行压缩只(pg)层一一保留主要特征,:经过池化压缩的矩阵输入个全连接的神经网络层这层通过计算加权和得到一个实数输出分数,将
6、该分数与目标分数相比较,计算出误差,一反向传播给前面各层,通过误差调整各层参数,最终拟合得到个模型,就是序列特异性预测模型。关键词S序列特异性;模体识别;DNA结合蛋白;卷积神经网络IAbstractAbstradPredictingtheseuencesecificitiesofenesisessentialforeneanalzinandqpggygenereuDNA-NA-latory.Thesequencespecificitiesofan
7、dRbindinroteinsaregggpusedtoidenticausaldiseasevariants.Howeverthedevelopmentsofmolecularfy,biologybrinsexlosiverowthofbioloicaldata?化isreallhard化discoversomegpggyusefUm的sagethroughtraditionalbiologicalexperimentsorstatistics
8、,anditcosts化much.Convolutionneuralnetworkis泣deeplearning化chnoloemerininrecentgyggears.Ithasbeenwidelyusedinimaerecognitionseechrecon化iona
此文档下载收益归作者所有