欢迎来到天天文库
浏览记录
ID:24544809
大小:49.50 KB
页数:4页
时间:2018-11-13
《延迟效应重构网络算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、延迟效应重构网络算法研究刘飞(宝鸡文理学院物理与光电技术学院,陕西宝鸡721016)摘要:大量调控网络重构的模型和方法被研究,但是数据大小对算法精度的影响问题涉及很少。通过研究数据尺寸大小对延迟信息论方法构建基因调控网络精度的影响,表明基因调控网络构建的精度会在一定数据尺寸规模下达到一个稳态。为了克服互信息的一些缺点,引入了多时延互信息值计算两个基因之间的调控关系,构建的基因调控网络取得了很好的查全率和查准率。并用真实的生物分子网络进行测试,实验表明,基于多时延的策略在构建基因调控网络中扮演了一个重要角色。.jyqk]),Y=(y[1],y
2、[2],?,y[m]),这里m代表时间点数。假定τ为基因X和Y之间的时间延迟,τ=0,1,2,?,m-1。取X(τ)=(x[1],x[2],?,x[m-τ]),Y(τ)=(y[τ+1],y[τ+2],?,y[m]),根据互信息的公式,在给定m值的情况下,可计算出基因X,Y之间的互信息I(X(τ):Y(τ)),当互信息I(X(τ):Y(τ))的值最大时,τ值作为基因X,Y之间的调控转录时延。1.2互信息的定义信息熵是一个随机变量的平均不确定性,它用H表示,p(Xi)为Xi出现的概率,其公式如下:2结果仿真2.1数据量大小和网络构建精度的关系采
3、用文献[7]的网络基因时序数据构建网络,并和原始的真实网络进行比对,得出构建网络的查准率和查全率。不同基因数用不同时间点构建网络得到的查准率和查全率如图1,图2所示。在图1中20个基因的网络查准率一直在增加;在40个时间点时达到最大值;在50个时间点以后查准率一直处于一个平稳的状态;30个基因点的网络查准率在整个过程中一直波动缓慢上升;50个基因点的网络查准率在45个时间点以后基本处于平稳状态,图2亦然。为了进一步说明基因时序数据尺寸大小对网络推断精度的影响,提出用查全率和查准率的比值来度量网络构建的精度,如图3所示。20个基因的网络查全率
4、和查准率的比率一直在下降,当取50个时间点时其比率基本趋于稳定状态。对于40个基因的网络构建来说,当时间点取到50个以上时,其网络构建的精度基本保持不变,时间点取得越多只会增加算法的时间和空间复杂度。这样就可以在基因时序数据尺寸最小的情况下取得网络构建的最大精度。2.2真实网络模拟由完整的酵母细胞周期基因表达数据来构建基因调控网络,如图4所示,分别列出了用互信息构建的网络和用时延互信息构建的网络,实线表示预测正确的边,虚线表示预测错误的边,箭头表示基因调控的方向。网络预测的结果用敏感度(Sn),特异度(Sp)和精确度(Acc)指标来衡量,其
5、公式定义为:Sn=TP(TP+FN),Sp=TN(FP+TN),Acc=(TP+TN)(TP+FP+TN+FN)。网络中用TLMI方法识别出正确的边数多了1条,识别出错误的边数少了3条,因此它的特异度从88.05%增加到89.53%,精确度从73.64%增加到77.27%。因此得出用TLMI方法比MI方法在基因调控网络构建精度上明显提高,TLMI对基因调控网络构建精度是一个更好的衡量指标。3结论本文首先研究了基因时序数据尺寸大小对网络构建精度的影响,研究显示,数据尺寸的大小在网络构建精度中扮演了一个很重要的角色。目标是在最小的数据尺寸下得出
6、最大的网络构建精度,以此降低算法的时间和空间复杂度。其次研究了用互信息和延时互信息方法构建基因调控网络,结果显示,采用多时延的策略下,基因之间多时延的转录调控对网络构建有很大影响,延时的互信息方法对构建基因调控网络在特异度和精确度上都有明显的提高。
此文档下载收益归作者所有