欢迎来到天天文库
浏览记录
ID:1145622
大小:3.03 MB
页数:7页
时间:2017-11-08
《基于小波的肿瘤基因表达数据聚类分析模型》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第17卷第5期(自然科学版)Vol.17No.52011年10月JOURNALOFSHANGHAIUNIVERSITY(NATURALSCIENCE)Oct.2011doi:10.3969/j.issn.10072861.2011.05.010基于小波的肿瘤基因表达数据聚类分析模型黄文佳,冯铁男,王翼飞(上海大学理学院,上海200444)摘要:运用小波的降噪性建立一种基于肿瘤基因表达谱的聚类分析模型,采用小波变换、信息抽取、双向聚类的方法对基因表达谱进行有效的分析.通过这种模型,可以降低基因表达谱的噪音以及样本错聚率.最后,将该方法应用于结肠癌基因表达谱的分析.关键词:基因
2、表达数据;小波变换;特异表达基因;聚类分析中图分类号:O235文献标志码:A文章编号:10072861(2011)05062407WaveletBasedClusterAnalysisModelofTumorGeneExpressionDataHUANGWenjia,FENGTienan,WANGYifei(CollegeofSciences,ShanghaiUniversity,Shanghai200444,China)Abstract:Thispaperintroducesamodelofclusteringanalysisoftumorgenedataexp
3、ressionusingwaveletfornoisereduction.Themodelanalyzesthegeneexpressiondataeffectivelyusingthemethodsofwavelettransfer,dataminingandcoupledtwowayclustering.Withthismodel,noiseinthegeneexpressiondatacanbereducedandaccuracyofsampleclassificationcanbeincreased.Themodelisappliedtotheanalysisofg
4、eneexpressiondataofcolon.Keywords:geneexpressiondata;wavelettransformation;specificexpressedgenes;clusteranalysis基因芯片(genechips)是目前最主要的且发展表达数据,该技术已被广泛应用于生物医学、疾病诊[1][2]最早、最快的生物芯片.将待测样本标记后与基因断和药物筛选等多个领域.由于基因表达的信号芯片进行杂交,经激光共聚焦荧光扫描仪扫描,通过值常常受到噪音的污染,而传统的研究方法无法将其电脑系统处理、分析即可得到相应的信号值.信号值去除,因此经常在发现特异
5、表达基因时出现较高的假代表了结合在探针上的待测样本中特定大分子的信阳性,降低了样本聚类的准确率,并且对研究基因表息,从而可检测对应片段是否存在及存在量的多少.达模式、提取分类特征基因等带来了一定的困难.狭义的基因芯片又叫DNA微阵列(DNAmicroarray),小波变换(wavelettransformation)是空间(时间)主要包括cDNA微阵列和寡核苷酸微阵列.和频率的局部变换,因而能有效地从信号中提取信DNA芯片技术作为一种高通量的基因表达分息,通过伸缩和平移等运算功能,可对函数或信号进析平台,通过一次试验就能获得成千上万个基因的行多尺度的细化分析,特别适用于非稳定
6、信号的信收稿日期:20100111基金项目:国家自然科学基金资助项目(30871341);上海市重点学科建设资助项目(S30104);上海市教委重点学科建设资助项目(J50101)通信作者:王翼飞(1948~),男,教授,博士生导师,研究方向为计算分子生物学.Email:yifei_wang@staff.shu.edu.cn第5期黄文佳,等:基于小波的肿瘤基因表达数据聚类分析模型625[3]息提取.为解决聚类过程中存在的一些问题,本研究通过对基因表达数据进行小波变换,降低表达值中的噪音,从而为提取出基本信息建立了一种新的聚类分析模型.通过该模型选取的特异表达基因,对于肿
7、瘤样本的分类、肿瘤疾病的诊断和治疗都具有重要意义.1聚类分析模型1.1传统的肿瘤聚类分析模型[4]肿瘤聚类分析模型假设具有相同或相似表达模式的基因功能相同或相近,因此通过聚类分析可以将基因分为不同的类型,同时选取出少量的特异表达基因对样本进行聚类.肿瘤聚类分析模型的主要流程如下:①获取基因表达数据,并对数据进行预处理和归一化;②依次计算每个基因的综合属性,将每个基因在不同样本中的表达值转化为一个数值;③选取少量的特异表达基因,选择一种聚类分析方法对基因和样本分别进行聚类,将表达模式相似的基因聚为一类,这
此文档下载收益归作者所有