机器学习大作业----机器学习与生物信息学

机器学习大作业----机器学习与生物信息学

ID:38633299

大小:72.68 KB

页数:15页

时间:2019-06-16

机器学习大作业----机器学习与生物信息学_第1页
机器学习大作业----机器学习与生物信息学_第2页
机器学习大作业----机器学习与生物信息学_第3页
机器学习大作业----机器学习与生物信息学_第4页
机器学习大作业----机器学习与生物信息学_第5页
资源描述:

《机器学习大作业----机器学习与生物信息学》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、机器学习大作业机器学习与生物信息学摘要本文首先介绍了生物信息学的概念、产生的背景、主要的研究方法、研究方向以及机器学习的相关概念。然后通过比较两者所需解决的问题得到机器学习在解决生物信息学相关问题方面可以得到应用,并结合现实的应用,介绍了机器学习在生物信息学各方面的现实已有应用。最后对两者关系进行总结,得出两者在未来会相互促进、共同发展。关键字:生物信息学机器学习目录第一章生物信息学的基本概念以及产生背景11.1生物信息学的定义11.2生物信息学的产生背景1第二章生物信息学的研究方法及一般步骤32.1生物信息学的研究方法32.2研究生物信息学的一般步骤3第三章当前生

2、物信息学的主要研究方向43.1序列比对43.2蛋白质结构比对和预测43.3基因识别非编码区分析研究53.4分子进化和比较基因组学53.5序列重叠群(Contigs)装配63.6遗传密码的起源63.7基于结构的药物设计63.8生物系统的建模和仿真63.9生物信息学技术方法的研究73.10生物图像73.11其他7第四章机器学习与生物信息学84.1机器学习84.2机器学习与生物信息学8第五章结论11第一章生物信息学的基本概念以及产生背景1.1生物信息学的定义生物信息学时生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科:以核酸、蛋白质等生物大分子数据库作为所

3、要研究的对象,并利用数学、信息学、计算机科学等手段,以计算机硬件、软件和计算机网络为主要工具,对数量极其庞大的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、探索、比较、分析,从中获取基因编码、基因调控、核苷酸和蛋白质结构功能及其相互关系等理性知识。在大量的信息和知识的基础上,探索生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中的重大问题,搞清它们的基本规律和时空联系,建立“生物学周期表”。它通过对生物学实验数据的获取、加工、存储、检索和分析,从而达到揭示数据所蕴含的生物学意义的目的。目前其主

4、要的研究重点为基因组学(Genomics)和蛋白组学(Proteomics)两方面,具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构和功能的生物信息。目前基因组学的研究出现了几个重心转移:一个是将一直基因序列与功能联系在一起的功能基因组学的研究;一个是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因装箱探索发病机理;四是从疾病诊断转向疾病易感性研究。生物芯片的应用将为上述研究提供最基本和必要的信息和依据,将作为基因组学研究的主要技术支撑。生物信息学的发展为生命科学的进一步突破以及药物研制过程中革命性的改革提供了一个机会。就人类基因组来说,

5、得到序列仅仅是第一步,后一步工作时所谓后基因组时代(post-genomeera)的任务,即收集、整理、检索和分析序列中表达的蛋白质的结构和功能信息,找出规律。1.2生物信息学的产生背景生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在,1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体

6、11蛋白质携带基因,而DNA是一个次要的角色。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年JamesWatson和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。DNA以磷酸糖链形成发双股螺旋,脱氧核糖上的碱基按Chargaff规律构成双股磷酸糖链之间的碱基对。这个模型表明DNA具有自身互补的结构,根据碱基对原则,DNA中贮存的遗传信息可以精确地进行复制。他们的理

7、论奠定了分子生物学的基础。DNA双螺旋模型已经预示出了DNA复制的规则,Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNApolymeraseI),能使4种dNTP连接成DNA。DNA的复制需要一个DNA作为模板。Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Centraldogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。