基因表达数据的聚类分析

基因表达数据的聚类分析

ID:33091797

大小:1.41 MB

页数:38页

时间:2019-02-20

基因表达数据的聚类分析_第1页
基因表达数据的聚类分析_第2页
基因表达数据的聚类分析_第3页
基因表达数据的聚类分析_第4页
基因表达数据的聚类分析_第5页
资源描述:

《基因表达数据的聚类分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着人类基因组计划的进展,对于基因的功能和基因组内各基因的研究逐步深入。研究基因在不同时间和条件下的表达情况,是认识基因功能的一个主要途径。cDNA微阵列技术可以同时测量全基因组的基因的表达情况,是生物学家认识基因的重要工具。微阵列技术产生了大量基因表达数据,要从中提取有价值的信息,采用数据挖掘的技术是十分必要的。功能相近的基因其表达模式相似,通过发现相似的表达模式可以预测未知基因的功能。数据挖掘中的聚类算法是按照数据的相似性进行划分,实现物以类聚的思想。本文采用聚类技术对基因表达数据进行处理,可以把表现模式相近的

2、基因聚集到一起,这种划分有助于专业人员发现基因功能和遗传模式。要通过研究表达数据得到基因的功能和调控关系,需要找到恰当的分析方法。本文介绍分析了常用于生物数据分析的聚类算法,其中层次聚类、自组织特征映射网络、模糊平均值法各具特色。聚类中较为重要的一个问题是距离测度的选择,本文采用了欧式距离和相关系数,两者分别适用于空间分布较近和呈线性关系的数据聚类。所有的聚类算法都在网上公布的酵母基因表达数据上进行了实验分析,其中模糊平均值法效果最好。实验使用的是小规模的数据集,采用的聚类算法可以有效的对线性相关的数据进行划分。但是基

3、因之间具有复杂的调控关系,有些是间接的和非线性的,所以在这个领域的研究还需要不断深入下去。关键词:基因表达数据,模糊聚类,生物信息学,数据挖掘AbstractAstheHumanGenomeProjectdeveloping,theresearchonthegenes'functionandrelationshipofgenesingenomeprogressgradually.Analyzingtheexpressionofgenesisthemainapproachtofindoutfunctionsofgenes

4、.cDNAmicro-arraytechniqueprovidesbiologistswiththeabilitytomeasuretheexpressionofthousandsofgenesinasingleexperiment.Asdatafrommicro-arraytechniqueaccumulatesanddifferentexperimentshavetobecompared,itwillbeessentialtohavedataminingtechniquetoextractbiologicalsig

5、nificance.Geneswithsimilarfunctionhavesimilarexpression.Wecananticipategenes'functionsbyanalyzinggeneswithsimilarexpression.Clusteringalgorithmpartitionsdataaccordingtotheirsimilarity.Throughclustering,similarexpressiongenescanbeclusteredintothesamegroupthatishe

6、lpfulforbiologiststofindoutgeneticpathways.Itisnecessarytoadoptproperanalyzingalgorithmtodealwithcomplexgeneexpressiondata.Inthisthesis,severalrepresentativeclusteringalgorithmsareintroducedsuchashierarchicalalgorithms,self-organizingfeathercompetitivenetwork,an

7、dfuzzyc-meansalgorithmImportantforallclusteringtechniquesisthedistanceorsimilarityused.Inthisthesis,distancemeasuresconsisttheEuclideandistanceandcorrelation.Eachappliestoneardistributedandlinearrelateddata.Allthealgorithmsimplementonexpressiondataofyeastgenes.T

8、heresultofFuzzyc-meansisthebestofall.Smalldatasetisusedinexperimentsandtheclusteringalgorithmcanpartitionlinearrelateddataefectively.Butrelationshipsofgenesarecomplex

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。