生物信息学中的e-value和z-scores.doc

ID：56277319

大小：23.50 KB

页数：1页

时间：2020-06-05

资源描述：

《生物信息学中的e-value和z-scores.doc》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、生物信息学中的e-value和z-scores发信站:日月光华(2005年05月11日13:20:31星期三),站内信件blast里面的话e-value和z-score都是和序列匹配的显著程度有关的，核酸序列和蛋白序列都适用。你用blast搜索数据库，在每一对query和hit序列都会有一个e-value和一个z-score。E=-ln(1-p)其中的p表示你的query序列和目的序列匹配是由于随机造成的概率，也就是假阳性概率p的范围在0-1之间所以E的范围是0到正无穷假如一条很短的序列ATGG它匹配了另一条序列ACGG那么这两条序列的p值应该是(1/4)^3*(3/4)

2、=0.01171875E=-ln(1-p)=0.011787956（不知道计算有没有失误....）不过原理就是这样的因此e-value越小则序列匹配得越好z-score统计学上的意义是某变量与均值的偏差再除以方差，越大的话可能性越小与一些数据库的参数有关还有normalization的过程复杂我不写了总之，e-value和z-score是衡量序列相似性的指标，e越小，z越大，则两序列越相似evalue一般越小越好，也取决于你对数据的要求，一般0.01以上的是肯定不可信的。

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 / 1



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

生物信息学中的e-value和z-scores.doc

生物信息学中的e-value和z-scores.doc

相关文章

相关标签