欢迎来到天天文库
浏览记录
ID:38964403
大小:372.32 KB
页数:43页
时间:2019-06-22
《《生物信息学简介》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、揭开生命奥秘的新兴交叉学科第七章生物信息学内容生物信息学概念生物信息学的内容生物信息学的研究方法和技术生物信息学软件和数据库一、生物信息学的概念(p199)生物信息学是用数理和信息科学的观点、理论和方法,以计算机为工具对生物信息进行收集、加工、储存、传播、检索和分析的科学。研究材料和结果是各种各样的生物学数据人基因组海量信息23对=46条染色体30亿碱基对(basepairs)3~5万个基因基因组学3万种以上蛋白质蛋白质组学基因表达、作用、调控网络已经或即将完成的生物全基因组几百种原核生物酵母菌拟南芥(1-2亿bp)水稻
2、人类(32亿bp)小鼠大鼠猪鸡…..等生物信息学的概念后基因组时代的到来人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列正在面对指数扩增的基因序列和各种数据库面临如何将基因序列资料转变为有用的知识,进而服务于人类,造福人类健康的挑战人类功能基因组学必须多学科协作生物信息学技术生物芯片技术蛋白质组学技术高通量细胞筛选技术等生物信息学是人类功能基因组学研究的必要工具实验生物学计算生物学理论生物学生物信息的开发和应用以核酸蛋白质等生物大分子为主要研究对象以信息、数理、计算机科学为主要研究手段以计算机网络为主要研究环境以计
3、算机软件为主要研究工具对序列数据进行存储、管理、注释、加工对各种数据库进行查询、搜索、比较、分析构建各种类型的专用数据库信息系统研究开发面向生物学家的新一代计算机软件生物信息学的概念计算机学、计算机网络医学生物学、分子生物学生物信息学数学、统计学生物信息学和其它学科的关系生物信息学是一门边缘学科,它位于生物、医学、计算机、数学等多个领域的交叉点上生物信息学的概念蛋白质组学和结构基因组学高通量药物筛选药物设计和小分子设计创新药物和新剂型生物芯片计算机辅助药物筛选高通量虚拟筛选方法分子数据库,组合化学化合物库,靶标生物大分子的
4、功能分析...蛋白质-蛋白质相互作用识别,信号传导系统、代谢途径的分子模拟...图像处理、聚类分析、表达谱和调控网络分析...基因组信息…生物信息技术计算机辅助先导化合物设计、药物设计二、生物信息学的内容(p200)1.基因与基因组分析可读框预测和基因标注序列拼接与组装结果上传到数据库碱基读取载体标识与去除测序仪中原始数据的采样与分析大规模基因序列测定生物信息学的内容基因预测DNA序列中编码区的鉴定预测方法的依据:编码统计学:编码区序列同非编码区序列相比,有不同的特点,存在一些非随机的特点GC含量密码子偏倚性(CODONFR
5、EQUENCY)第三个碱基组成基因结构/统计学方法比较/同源性生物信息学的内容原核生物基因结构编码区启动子转录起始位点非翻译区转录区起始密码子终止密码子5’3’转录终止位点RBS生物信息学的内容5’启动子转录起始位点非翻译区转录区起始密码子终止密码子3’转录终止位点外显子切除和拼接位点GTAG内含子真核生物基因结构生物信息学的内容HMM?HMM描述了模型中各隐含状态的转换概率基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隐含状态用于基因预测的隐马尔可夫模型HiddenMarkovMod
6、els,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因组序列生物信息学的内容特定状态碱基对的概率取决于它前面碱基对的状态向另一种状态的转换概率取决于转换信号的出现(剪切位点)和/或在特定隐藏状态的碱基对平均数量(即内含子或外显子大小).IntronsExonP=0.5P=0.8基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCG用于基因预测的隐马尔可夫模型生物信息学的内容研究主要集中在核苷酸序列的存储、分类、检索和分析等方面新基因的发现非蛋白编码区生物学意义的分析基因组整体功能及其调节网络的系统
7、把握基因组演化与物种演化基因组分析生物信息学的内容蛋白质结构新蛋白的完整、精确和动态的三维结构计算机辅助结构模拟理解蛋白质的氨基酸序列和三维结构之间的关系蛋白质序列及特性分析蛋白质组学2.蛋白质与蛋白质组分析生物信息学的内容相当数量的蛋白质、核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为热点;根据靶标分子与药物分子相结合的活性部位的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。3新药设计三、生物信息学的研究方法和技术数学统计方法在分析DNA语言中的语义、分析密码子使用频率、利用马尔可夫
8、模型进行基因识别动态规划(DynamicProgramming)方法一种通用的优化方法:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。DNA序列或者蛋白质序列的两两对比排列模式识别技术两种方法根据统计特征进行识别根据对象的结构特征进行识别,
此文档下载收益归作者所有