欢迎来到天天文库
浏览记录
ID:33091797
大小:1.41 MB
页数:38页
时间:2019-02-20
《基因表达数据的聚类分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要随着人类基因组计划的进展,对于基因的功能和基因组内各基因的研究逐步深入。研究基因在不同时间和条件下的表达情况,是认识基因功能的一个主要途径。cDNA微阵列技术可以同时测量全基因组的基因的表达情况,是生物学家认识基因的重要工具。微阵列技术产生了大量基因表达数据,要从中提取有价值的信息,采用数据挖掘的技术是十分必要的。功能相近的基因其表达模式相似,通过发现相似的表达模式可以预测未知基因的功能。数据挖掘中的聚类算法是按照数据的相似性进行划分,实现物以类聚的思想。本文采用聚类技术对基因表达数据进行处理,可以把表现模式相近的
2、基因聚集到一起,这种划分有助于专业人员发现基因功能和遗传模式。要通过研究表达数据得到基因的功能和调控关系,需要找到恰当的分析方法。本文介绍分析了常用于生物数据分析的聚类算法,其中层次聚类、自组织特征映射网络、模糊平均值法各具特色。聚类中较为重要的一个问题是距离测度的选择,本文采用了欧式距离和相关系数,两者分别适用于空间分布较近和呈线性关系的数据聚类。所有的聚类算法都在网上公布的酵母基因表达数据上进行了实验分析,其中模糊平均值法效果最好。实验使用的是小规模的数据集,采用的聚类算法可以有效的对线性相关的数据进行划分。但是基
3、因之间具有复杂的调控关系,有些是间接的和非线性的,所以在这个领域的研究还需要不断深入下去。关键词:基因表达数据,模糊聚类,生物信息学,数据挖掘AbstractAstheHumanGenomeProjectdeveloping,theresearchonthegenes'functionandrelationshipofgenesingenomeprogressgradually.Analyzingtheexpressionofgenesisthemainapproachtofindoutfunctionsofgenes
4、.cDNAmicro-arraytechniqueprovidesbiologistswiththeabilitytomeasuretheexpressionofthousandsofgenesinasingleexperiment.Asdatafrommicro-arraytechniqueaccumulatesanddifferentexperimentshavetobecompared,itwillbeessentialtohavedataminingtechniquetoextractbiologicalsig
5、nificance.Geneswithsimilarfunctionhavesimilarexpression.Wecananticipategenes'functionsbyanalyzinggeneswithsimilarexpression.Clusteringalgorithmpartitionsdataaccordingtotheirsimilarity.Throughclustering,similarexpressiongenescanbeclusteredintothesamegroupthatishe
6、lpfulforbiologiststofindoutgeneticpathways.Itisnecessarytoadoptproperanalyzingalgorithmtodealwithcomplexgeneexpressiondata.Inthisthesis,severalrepresentativeclusteringalgorithmsareintroducedsuchashierarchicalalgorithms,self-organizingfeathercompetitivenetwork,an
7、dfuzzyc-meansalgorithmImportantforallclusteringtechniquesisthedistanceorsimilarityused.Inthisthesis,distancemeasuresconsisttheEuclideandistanceandcorrelation.Eachappliestoneardistributedandlinearrelateddata.Allthealgorithmsimplementonexpressiondataofyeastgenes.T
8、heresultofFuzzyc-meansisthebestofall.Smalldatasetisusedinexperimentsandtheclusteringalgorithmcanpartitionlinearrelateddataefectively.Butrelationshipsofgenesarecomplex
此文档下载收益归作者所有