基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf

基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf

ID:55730208

大小:933.67 KB

页数:5页

时间:2020-06-03

基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf_第1页
基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf_第2页
基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf_第3页
基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf_第4页
基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf_第5页
资源描述:

《基于改进MS-EM算法的贝叶斯网络学习法构建基因调控网络.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第32卷第3期佳木斯大学学报(自然科学版)Vo1.32No.32014年o5月JournalofJiamusiUniversity(NaturalScienceEdition)May2014文章编号:1008—1402(2014)03—0436—05基于改进MS—EM算法的贝叶斯网络学习法构建基因调控网络①方跃胜,姚宏亮2(1.安徽水利水电职业技术学院,安徽合肥231603;2.合肥工业大学计算机与信息学院.安徽合肥230009)摘要:基因调控网络的重构是功能基因组中最具挑战性的课题之一.实验证明构建基因调控网络的最有前途的方法是贝叶斯网络.EM算法是一种

2、有效的利用数据来学习贝叶斯网络的方法,能较好地处理构建基因调控网络中的数据缺失情况,但存在学习精度低、对初始参数值依赖的缺点.本文应用贝叶斯网络实现啤酒酵母细胞基因调控网络的构建,用改进的MS—EM算法进行学习,并实现实验结果的可视化.与现有文献比较,结果表明改进后的算法进一步降低了时间性能,提高了构建调控网络的精度.关键词:基因调控网络;贝叶斯网络;EM算法中图分类号:TP181文献标识码:A好地与给定实例数据集拟合的网络.贝叶斯网络结0引言构学习的关键在于寻找到一个好的搜索算法和一基因调控网络(GRN,GeneRegulationNet.个对网络结构进

3、行有效评估的方法】.work)的研究目的是期望从系统的角度全面揭示基目前用于贝叶斯构建基因调控网络的贪心搜因组的功能和行为.基因调控网络是由细胞中相互索GS、MWST和K2等网络学习算法,常被用来处作用的基因片段以及其它起调控作用的物质共同理完备数据下的结构学习.EM(ExpectationMaxi—构成的调控网络,它表征了细胞中基因之间的调控mization)算法通过对数据进行充分统计来得到后关系,指导着基因到mRNA的表达过程¨J.在基因验概率分布的平均估计,然后通过最大似然得到和调控网络的建模方面主要的数学模型和方法有:线数据拟合的最好的网络.另外,

4、EM算法对用于学性模型、布尔网络模型、聚类分析和贝叶斯网络习的数据依赖小,数据可以不完备.标准的EM算等J.以上是系统生物学中常用的建模方法.但由法是用于丢失数据的参数估计的,它是对固定网络于这些模型对数据和建模对象的要求很高,目前在结构进行参数学习.Friedman等人提出了一种扩实际应用中还有许多问题有待解决.生物信息学研展的EM算法可以进行结构学习,称为MS—EM算究的一个热点是利用贝叶斯网络构建基因调控网法(ModelSelectionEMalgorithm)(.络,贝叶斯网络被认为是构建基因调控网络的最有前途的方法J.贝叶斯网络亦称信念网络(Be

5、liefNetwork),它是一种不确定性处理模型,用来模拟人类推理过程中因果关系的J.根据处理的基因表达数据无序图1改进的MS—EM算法实现结构与有序的区别,贝叶斯网络分为静态和动态两个分支.学习贝叶斯网就是要寻找一种能按某种测度最①收稿日期:2014—03—17基金项目:国家自然科学基金资助项目(60705015)、安徽省自然科学基金项目(KJ2013B095).作者简介:方跃胜(1975一),男,安徽舒城人,合肥工业大学硕士研究生,安徽水利水电职业技术学院讲师,主要从事人工智能和图形学的教学与研究,通讯作者:姚宏亮(1972一)。男,安徽桐城人,博士

6、,合肥工业大学副教授,主要研究方向为人工智能与机器挖掘.第3期方跃胜,等:基于改进MS—EM算法的贝叶斯网络学习法构建基因调控网络4371改进的Ms—EM算法篓霎篇本文采用改进的MS—EM算法进行结构学改变模型的选择来获取评分的改进.这种算法在某习.因为从计算上说,最大化一个固定模型的参数些情况下还可以避免局部极大化.改进的算法描述比搜索一个更好的模型代价小的多,这个参数的最如下:图2系统开发流程图用概率图模型中的贝叶斯网络【8】.贝叶斯网络具有丰富的随机特性,所以特别适合于处理微阵列数据这样由于实验条件限制而含有大量噪声的数据.本文中使用Spellman

7、l9等人于1998年提出的啤酒酵母(SaccharomycesCerevisiae)细胞周期微阵列表达谱数据集.这些基因表达数据集描述了酵母菌在细胞周期过程中的基因表达特性.算法中要求数据是离散的,所以在编写算法中将连续的数据进行了离散化处理.图3实验平台的进人界面2.2系统的总体要求随机的选择和,loop,l=0,1,⋯.直至算法收敛,loopZ=0,1,⋯.直至算法收敛或者Z=开发环境:用VC作界面,调用MATLAB下的Z一,使得0“=argmaxQ(/W',:,),寻找一M脚本文件实现功能.个模型“,使得Q(·:Mn0)最大化让参数功能要求:(1)采

8、用EM算法从样本学习贝叶0I.。=argmaxQ(”,:,0).改

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。