基于弹性网络的大鼠肝再生关键基因选择-论文.pdf

基于弹性网络的大鼠肝再生关键基因选择-论文.pdf

ID:55059417

大小:192.48 KB

页数:3页

时间:2020-05-08

基于弹性网络的大鼠肝再生关键基因选择-论文.pdf_第1页
基于弹性网络的大鼠肝再生关键基因选择-论文.pdf_第2页
基于弹性网络的大鼠肝再生关键基因选择-论文.pdf_第3页
资源描述:

《基于弹性网络的大鼠肝再生关键基因选择-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷第5期河南师范大学学报(自然科学版)V_0Z.41No.52013年9月JournalofHenanNormalUniversity(NaturalScienceEdition)Sept.2013文章编号:1000—2367(2013)05—0026—03基于弹性网络的大鼠肝再生关键基因选择王小玉,陈留院,刘云卿。,杨云,李钧涛,徐存拴(河南师范大学a.数学与信息科学学院;b.学报编辑部;C.河南省一科技部共建细胞分化调控国家重点实验室培育基地,河南新乡453007)摘要:针对大鼠肝再生基因表达谱芯片数据挖掘问题,通过把肝再生过程划分为8个不同时间的子过程,将其转

2、化为二分类问题,进而利用弹性网络对每1个子过程分别进行分类和相关基因选择,此外,以细胞增殖为主线,分析了所选择基因间的通路关系,验证了所选基因的生物合理性.关键词:大鼠肝再生;弹性网络;基因选择中图分类号:TP273文献标志码:A以支持向量机为代表的统计机器学习口是现代人工智能的1个热门研究领域,其已被成功地应用于图像处理、模式识别、数据挖掘、癌症基因选择等领域_2].特别地,统计机器学习为解决具有“小样本、超高维”特性的微阵列基因表达谱数据(基因芯片数据)分析开辟了新的途径.例如,文献E2]提出了基于支持向量机的递归特征消除基因选择方法;为了能够成群地自动选择基因,文献

3、E33提出了弹性网络方法;为了进一步激励自适应群体基因选择性能,文献[4]提出了稀疏对数回归方法.在大鼠肝再生的过程中,有成千上万的基因表达值发生了改变,利用高通量的芯片技术可以同时检测基因组里几乎所有基因值的表达变化,如何在数量庞大的基因中筛选出肝再生过程中起重要作用的关键基因是当前芯片数据挖掘工作的1个挑战性问题.本文利用既具有良好基因选择性能又具有快速求解性能_5]的弹性网络方法从大鼠基因表达谱芯片数据中筛选大鼠肝再生的关键基因,并用Pathwaystudio8.0软件构建所选择基因间的通路来验证所提方法的合理性和有效性.1问题描述给定训练数据集{(z,Y)},其中

4、一(,⋯,-z)表示输入向量,Y∈[+1,一1]表示样本分类标签.通常的二分类问题就是利用已知数据学习得到决策函数.厂:R一一H一1,一1},进而获得测试数据的分类标签.令Y一(,2,⋯,),X一(z1;372...·;z)一((1】,z(2),⋯,z()),其中z一(lJ,⋯,zw)被称为预测子.本文假设预测子是标准化的,响应具有零均值,即:∑z一0,∑z2一1,∑一0.(1)i一1一1i=1本文所用训练数据集来自于河南省一科技部共建细胞分化调控国家重点实验室培育基地研制的大鼠肝再生手术组基因芯片数据.按Higgins等方法切除大鼠肝的左叶和中叶(partialhepa

5、tectomy,PH),取手术后恢复、2、6、12、24、30、36、72、120和168小时的再生肝分离肝细胞进行制作芯片.每个时间点(用3张芯片)收稿日期:2O1211—25;修回日期:2013-05—26基金项目:国家自然科学基金(61203293);河南省重点科技攻关计划(122102210131;122102210132);河南省基础与前沿技术研究(132300410389;132300410390);河南省教育厅科技攻关计划(13A120524);河南省高校科技创新人才支持计划(13HASTIT040);河南省高校青年骨干教师资助计划(2012GGJS-063

6、)作者简介:陈留院(1980-),男,河南商水人,河南师范大学编辑,武汉理工大学博士研究生,主要从事统计机器学习、期刊评价等方面的研究.通信作者:徐存拴,河南师范大学教授,博士生导师,主要从事肝再生分子生物学、系统生物学等研究.第5期王小玉,等:基于弹性网络的大鼠肝再生关键基因选择27重复检测3次,分别同正常对照组比较后产生9个对数比值.在该数据集中,基因个数P等于24618个,每个时间点的样本个数为9个.本文的目的是通过统计机器学习的方法,分时间段来从这些基因芯片数据中筛选出大鼠肝再生关键基因.2基于弹性网络的肝再生关键基因筛选通过结合平方误差损失函数与弹性网络惩罚函数

7、,文献E33提出了弹性网络模型:()一(1+z)(),()一argrainllY一l+llll+zl【lI,(2)PP其中_lpll。一∑,l}lI一∑Il,,>0表示正则化参数.弹性网络同时具有脊回归和lasso的特点,不仅能自动地进行变量选择,而且能激励群体变量选择效应.为了能够利用顺向坐标下降算法来求解,该模型可转化为如下形式]:()一argrainllY一邵lI。+a(al卢+(1一口)lI卢lI。).(3)假设和的估计子为。和,顺向坐标下降算法的目的是获得部分最优化的,(≠£).为此,首先需要计算===(≠0)点的梯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。