欢迎来到天天文库
浏览记录
ID:48743542
大小:1.33 MB
页数:21页
时间:2020-01-21
《整合PPI与基因表达谱.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、TowardstheidentificationofproteincomplexesandfunctionalmodulesbyintegratingPPInetworkandgeneexpressiondata报告人:李光辉Limin.BMCBioinformatics,2012背景在蛋白质相互作用网络中识别蛋白质复合物和功能模块有助于理解细胞组织的原理及预测蛋白质的功能.在过去几十年,提出了许多计算方法用于聚类PPI网络.不足:传统的聚类方法将PPI网络视为一个静态图,忽视了这类网络的内在的动态性;未区分蛋
2、白质复合物与功能模块.2021/9/182/15蛋白质复合物与功能模块蛋白质复合物在相同时间和空间上相互作用的一组蛋白质;功能模块参与一个特定细胞过程的一组蛋白质,而这组蛋白质在不同的时间和空间上相互作用.2021/9/183/15动态PPI网络的构建数据集:DIP:yeastPPI36个含时序的基因表达谱数据及周期性转录数据时序子网络(TSNs)的构建过滤基因表达谱映射过滤后的基因表达谱与静态PPI相互作用数据2021/9/184/15蛋白质复合物与功能模块识别的框架2021/9/185/15TSN-PCD:
3、基于时序子网络的蛋白质复合物发现算法在每一个时序子网络中使用基于边聚集值的层次聚类算法发现复合物.边聚集值模块定义:H是带权图G的一个子图2021/9/186/15TSN-PCD:基于时序子网络的蛋白质复合物发现算法2021/9/187/15TSN-PCD:基于时序子网络的蛋白质复合物发现算法2021/9/188/15DFM-CIN:在复合物相互作用网络识别功能模块若两个复合物至少出现在同一个时序子网络中,则称它们是同步的.若两个复合物出现在两个连续的时序子网络中,则称它们是邻接的.两个复合物的相似性复合物相互
4、作用网络的构建一个顶点代表一个复合物,边表示两复合物之间的联系.若两个复合物是同步和邻接的,且相似性大于等于阈值th,则这两个复合物有一条边相连.2021/9/189/15DFM-CIN:在复合物相互作用网络识别功能模块子图K的模块性记为簇K一个邻居节点,该节点对簇K的模块贡献值定义为:2021/9/1810/15DFM-CIN:在复合物相互作用网络识别功能模块算法步骤:记G(V,E)是一个复合物相互作用网络图G中的所有顶点按照其出现的频率的非递增顺序插入到队列Q中;选择队列Q中第一个元素做为种子,并初始化为一
5、个单独的簇K;a.计算簇K的所有邻居节点对于模块K的贡献值若存在正的贡献值,则选择拥有最大贡献值的邻居节点加入到簇K中,并跳到b;若不存在则停止簇K的扩展,且将簇K的所有顶点从队列Q中删除,并跳到3;b.重复a过程重复步骤2,直到队列Q为空.2021/9/1811/15DFM-CIN:在复合物相互作用网络识别功能模块2021/9/1812/15DFM-CIN:在复合物相互作用网络识别功能模块2021/9/1813/15复合物评价指标识别复合物与已知复合物重叠得分特异性(specificity,Sp)是指算法识别
6、的蛋白质复合物中识别正确的部分所占比重敏感度(sensitivity,Sn)是指已知蛋白质复合物中被算法标识出来的部分所占比重其中TP表示算法识别的蛋白质复合物中与己知蛋白质复合物匹配的数量,FP等于识别的蛋白质复合物总数减去TP,FN表示己知蛋白质复合物中没有被标识的数量2021/9/1814/15复合物评价指标综合评价指标F:特异性和敏感度的调和平均数2021/9/1815/15实验结果2021/9/1816/15实验结果2021/9/1817/15功能模块的富集分析组成功能模块的一组蛋白质倾向于参与同一生
7、物过程中.根据超几何聚集分布的P-value来注释识别的功能模块的主要功能,P-value体现了识别的模块对某个功能的富集程度,其计算公式为:其中,N表示蛋白质网络的规模,C表示功能模块中的蛋白质数量,k表示功能模块中含有某个功能的蛋白质数量,F表示蛋白质网络中含有该功能的蛋白质数量.2021/9/1818/15实验结果2021/9/1819/15蛋白质复合物与功能模块关系一个功能模块通常包含多个复合物;包含在同一功能模块中的复合物倾向于参与同一生物过程.2021/9/1820/152021/9/1821/16
8、谢谢!
此文档下载收益归作者所有