生物信息学课堂测验中科大

生物信息学课堂测验中科大

ID:8929175

大小:19.57 KB

页数:2页

时间:2018-04-12

生物信息学课堂测验中科大_第1页
生物信息学课堂测验中科大_第2页
资源描述:

《生物信息学课堂测验中科大》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学课堂测验1.蛋白质的磷酸化是最重要的一种翻译后修饰,实验学家最近鉴定了某个激酶X的底物,总共20个底物蛋白质,序列平均长度500aa。在这些蛋白质上,总共鉴定了50个位点。基于这些实验数据,生物信息学家构建了相关的计算预测工具。对于给定的两个蛋白质序列A和B,长度分别为500aa和800aa,计算工具预测这两个蛋白质上分别有10和4个潜在的位点。考虑到计算工具本身具有一定的错误率,对于A和B,预测出来的位点,若全部是随机产生的概率为多少?(泊松分布)2.发现细胞有丝分裂过程中参与重要功能的基因,可以通过基因芯片的方法进行研究。某实验室开展了一项工作,

2、对细胞有丝分裂期不加nocodazole以及加nocodazole两种条件下,对人的21,000基因做表达谱分析。其中发现表达量显著升高的基因为1,532个。进一步做功能分析,发现总共1,236个基因具有某种功能F,而在表达量显著升高的基因中,有32个基因具有该功能F。问:该功能F在表达量显著升高的基因中是显著出现,显著不出现,还是随机出现?要求:写出相关的计算公式,并填入实际数据,不计算最终结果。已知超几何分布的公式:(超几何分布)3.实验学家从1500个4bp的DNA序列中鉴定了300个某种X-box序列,其中第一位A的出现概率为0.91,第二位T出现的概

3、率为0.85,第三位A出现的概率为0.97,第四位C出现的概率为0.51,G出现的概率为0.47。其他位点出现的概率各自相同。现有两条序列,ATAC和ATAA,两条序列可能是X-box的概率为多少?(贝叶斯公式)4.对于两条蛋白质序列:IDRRPAE和LDRPAW,请分别用(1)Needleman-Wunsch算法;(2)Smith-Waterman算法对两条序列作比对;对于Gap的罚分为8,线性罚分规则;用图示法表明比对过程,并写出比对结果、得分。打分矩阵采用BLOSUM62矩阵,部分矩阵如下: ARDEILPWA4-1-2-1-1-1-1-3R-15-20

4、-3-2-2-3D-2-262-3-4-1-4E-1025-3-3-1-3I-1-3-3-342-3-3L-1-2-4-324-3-2P-1-2-1-1-3-37-4W-3-3-4-3-3-2-411(全局比对和局部比对)5.给定一组DNA序列如下:ACTTCCCAAGTTCCCAACTCGGCACCTTCGCA1)请根据上述DNA序列,写出两种PSSM;2)再给一条新的序列AGTCGCA,计算log-oddratio,该例中,碱基的背景值都为0.25;3)请分别计算第一位和第六位所包含的信息量6.请用图示法并辅以必要的文字,描述Gibbs采样抽取序列moti

5、f的过程。这里,假设有n条序列,长度k,待抽取的motif长度为m.7.请列举至少两种多序列比对算法,并简要列出算法的计算过程。ClustalXPRRP8.请用图示法并辅以必要的文字,描述基因表达数据聚类算法K-meansclustering算法的计算流程,假设有N个基因,拟分成M类。1.使用多序列工具比对两条序列,发现60%的区域相同,(1)若这两条序列为蛋白质序列,请计算泊松距离;(2)若两条序列为核酸序列,请计算Jukes-Cantor距离。泊松距离:-ln(0.6)=0.51Jukes-Cantor距离:d=-3/4ln(1-4/3p)=0.572.给

6、定一组DNA序列如下:CGACCTCCACCCTACCACCTGGTACAAC1)请根据上述DNA序列,写出两种PSSM;2)再给一条新的序列CCACCTC,计算log-oddratio,该例中,碱基的背景值都为0.25;3)请计算第二位和第三位所包含的信息量。3.假设基因组上有一种调控信号S,长度和位置不确定。信号S和基因组序列G的碱基分布频率分别为:CGATS0.40.40.10.1G0.10.10.40.4S与G之间的转移概率矩阵如下:SGS0.60.4G0.60.4请用Viterbi算法计算序列AATCCGTA,预测是否存在该调控信号S,并标出相应的位

7、置。(马尔科夫模型)4.如果题目三中,假设转移矩阵并不是最终的优化结果,采用Baum-Welch算法,你如何进行优化?这里,假设已经给你若干条实验数据作为训练样本。5.直系同源物(Ortholog)与旁系同源物(Paralog)之间有什么区别?请用图示法并辅以必要文字进行描述。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。