欢迎来到天天文库
浏览记录
ID:37943224
大小:648.63 KB
页数:9页
时间:2019-06-03
《基于微阵列基因表达谱的一种关联空间的癌症分类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据食道癌http://www.khbct.com/第4期2008年4月电子学报ACI’AEU日Cnl0NICASINICA基于微阵列基因表达谱的一种关联空间的癌症分类算法卢新国1,林亚平2,-,王海军1,李小龙1,易叶青1(1.湖南大学计算机与通信学院,湖南长沙410082;2.湖南大学软件学院,湖南长沙410082)摘要:利用微阵列基因表达谱分类癌症患者样本对患者的治疗具有非常重要的意义.针对高维、高冗余的微阵列基因数据中致癌因子存在局部相关性的特点,提出一种基于权重的关联空间分类模型(WeightbasedCl
2、assificationwithRelatedSpace,WCRS).基本思想是首先利用协方差矩阵的对角化来构建癌症组的关联宅间,并提出一种基于癌症关联空间的基因表达模式,然后提取使得癌症组具有最小组能量的最小扩展空间,最后在最小扩展空间上建立一种基于权重的癌症分类算法.实验结果表明,WCRS在精确度上比传统分类算法具有更好的性能.关键词:癌症分类;基因表达谱;关联空间中图分类号:TP391文献标识码:A文章编号:0372-2112(2008)04-614-06ARelativeSpaceBasedCancerClass
3、ificationwithGeneExpressionProfilesLU7Jn—gu01,删Ya-pin92”,WANGHai—junl,LIXiao-longI,YIYe-qinsl(1.SdtoolofComlmmandCanmuai删ion,HtmanUniversity,Changsha,Hunan410052,China;2.洲of黝2黼,Hunan‰妇,饧嘞,‰410082,cII讹)Abstract:Classificationofpatientsampleswilhgeneexpressionprofi
4、lesisiIllp删tOc嗽lrealn七nt.Inthelargeredun·dantandh讪dimensionalgeneexpressiondata,acallcefissensitivetosoftiecancerogenicfactorswhileanothercancerissensitiveto翻孤Ileothers.SoWeproposedaweightbasedclassificationwithrelativespace(WCRS).Themainideaisthatac孤1c料’srelativ
5、esp日ceisobta.hlcdvialbcdiagonalizationofitscovariancemaaix,andWebuiltthecancer’smodelbasedonitsrelativespace.Thentheenergyofacancerispresentedformeasuringitsrelativespaces,andaminimalspreadspacebasedclassificationalgodthmisp【0posed.TheexperimentsshowWCRSmakes良tte
6、fprecisionthantraditionalclas豳cations。Keywords:cano盯classification;geneexp豳onixofile;relativespace1引言对癌症的精确分类是提高癌症诊断准确率和治愈率至关重要的一个环节.近年来,研究人员利用基因微阵列(Microarray)技术获得大规模基因表达谱数据(GeneExpressionProfiles).一方面,在高维基因表达谱中存在大量噪声;另一方面,在大规模的基因表达数据中存在大量在分类学意义上的冗余基因.如何利用这种具有高维
7、、高噪、高相关(冗余)特点且只包含有限样本的基因表达谱数据,识别对疾病有鉴别意义的特征基因或与疾病相关的基因,为机器学习研究提出了新的课题【l’2J.降维方法经常被利用来处理高维、高噪问题.对于癌症检测与分类,一类主要的降维方法是特征选择法,包括信噪比(SlsndtoNoiseRatio,SNR)[3l,邻居分析收稿I=1期:2006-08-28;修回日期:20074)9-19基金项目:湖南省自然科学基金(No.07115085)(NeighborhoodAnalysis)[4l,排秩法(Rank/纠等.由于不同的特征选
8、择法使用的搜索机制和评价策略不同,挑选出的特征基因明显不同怕J.并且在高冗余的基因表达谱数据中选取数量有限的基因容易丢失有生物价值和分类意义的信息.另一类降维方法是特征变换法.CoMe等利用聚类方法【7.sJ产生基因簇,然后用簇的平均值训练检测癌症的感知器模型【9J.Khan等利用主分量分析法(PrincipalCo
此文档下载收益归作者所有