序列相似性的概念

序列相似性的概念

ID:17886807

大小:1.67 MB

页数:40页

时间:2018-09-08

序列相似性的概念_第1页
序列相似性的概念_第2页
序列相似性的概念_第3页
序列相似性的概念_第4页
序列相似性的概念_第5页
资源描述:

《序列相似性的概念》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、序列相似性的概念序列比较是如何进行的?----打分方案的原理(PrinciplesofScoringMatrices)Blosum距阵(TheBlosummatrices)距阵的使用效果(MatrixPerformance)通过一些测试显示,Blosum距阵用于在数据库中查找同源性序列时,效果比PAM距阵好。如上述,距阵从1到250PAM两极距离太远,可能引起不准确;而Blosum直接从最同源的序列的区间排比获取匹配率,不考虑进化距离。Blosum距阵的突变数据来源于未加gaps的序列区间排比,相当于蛋白序列的保守区。1Dotplots-序列相似性的作图分析序列

2、比较的问题(Theproblemwithsequencecomparison)序列比较:序列比较包括从两个或多个序列中找出所有显著相似的区域。最主要的问题是必须首先作出定义,对于生物序列来说何为显著相似。在开始讲程序之前,让我们先了解一下它们做些什么和为什么那样做。这一节主要是关于序列比较是如何进行的。2Dotplots-序列相似性的作图分析序列比较的问题(Theproblemwithsequencecomparison)当我们比较两个序列时,总是会对显著相似的区段比较感兴趣,可是从生物学的角度如何定义何为“显著相似”?为了更好的理解这一点,让我们先看看几个例子

3、。首先从比较两个简单序列开始。ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC

4、

5、

6、

7、

8、

9、

10、

11、

12、

13、

14、

15、

16、

17、

18、

19、CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT3Dotplots-序列相似性的作图分析序列比较的问题(Theproblemwithsequencecomparison)在这里我们只是简单的将两个序列并排比较,对比两个序列之间的碱基,将匹配的残基用垂直线标出,可见一个保守的区域。但是,是否还有更好的排比方式呢?显然,如果将其中一个序列相对另一序

20、列错开两个碱基位置,可以得到一个更好的排比结果(这里说更好是指得到更多相匹配的碱基)ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC

21、

22、

23、

24、

25、

26、

27、

28、

29、

30、

31、

32、

33、

34、

35、

36、

37、

38、

39、

40、

41、

42、

43、

44、

45、

46、

47、

48、

49、

50、

51、

52、

53、

54、

55、

56、

57、

58、CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT4Dotplots-序列相似性的作图分析序列比较的问题(Theproblemwithsequencecomparison)结论是,我们不能够简单的将两个序列头尾对应的排比,而是对各种可能的排比方式都进

59、行比较以找出最佳的排比结果。可是,这还不行。生物体有许多变化的机制,简单的从一个残基变为另一个残基只是其中之一,而插入和缺失也经常发生,我们是否可以将插入和缺失考虑进去,以得到更好的排比结果呢?ATGCATGCATGCATGCATATATATATAT----ATATATGCATGCATGCATGCATGC

60、

61、

62、

63、

64、

65、

66、

67、

68、

69、

70、

71、

72、

73、

74、

75、

76、

77、

78、

79、

80、

81、

82、

83、

84、

85、

86、

87、

88、

89、

90、

91、

92、

93、

94、

95、

96、

97、

98、

99、CGATCGATCGATCGATATATATATATGCATATAT----ATGCATGCATGCATGCAT5Dotplots-序列相似性的作图分析序列比较的问题(Theprob

100、lemwithsequencecomparison)这里我们用了连字号(--)来标记插入/缺失的事件。仅仅观察两个序列是很难知道是否有插入或缺失的发生的,因此我们将它简称为一个“indel”。插入“indels”通常会大大增加匹配残基的数目:在序列比较时必须考虑“gaps”的存在,采用“gaps”通常可以大大增加匹配残基的数量。----AT--GCAT--GCATGC--ATGCATATATATATAT----ATATAT----GCATGCATGCATGCATGC

101、

102、

103、

104、

105、

106、

107、

108、

109、

110、

111、

112、

113、

114、

115、

116、

117、

118、

119、

120、

121、

122、

123、

124、

125、

126、

127、

128、

129、

130、

131、

132、

133、

134、

135、

136、

137、

138、

139、

140、

141、

142、

143、CGATCG

144、--ATCG--AT--CG--------ATATATATATATGCATATATATGCATGCATGCATGCAT6Dotplots-序列相似性的作图分析序列比较的问题(Theproblemwithsequencecomparison)但是,在加入“gaps”后又会出现一个问题:这个排比是否还有意义呢?如上述例子,我们通过加入了许多“gaps”来增加相似度,仅仅为了得到多一些匹配残基数就加入许多的“gaps”,这样做是否值得呢?答案是:有时。(不很满意,是吗?)有时确实值得,而有时又不划算。如果我们需要使序列变化太大,那很可能是不值得的。怎样知道是否值得呢

145、?通过大量的观察研究表明

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。