基因表达数据加权模糊聚类算法研究

基因表达数据加权模糊聚类算法研究

ID:36556203

大小:3.78 MB

页数:58页

时间:2019-05-12

基因表达数据加权模糊聚类算法研究_第1页
基因表达数据加权模糊聚类算法研究_第2页
基因表达数据加权模糊聚类算法研究_第3页
基因表达数据加权模糊聚类算法研究_第4页
基因表达数据加权模糊聚类算法研究_第5页
资源描述:

《基因表达数据加权模糊聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号!登!!密级垒珏重庆邮电大学硕士学位论文英文题目墅造墨曼丛曼hQ塾£坠圣圣Y£!坠兰丝!i坠g△!gQ!i尘堕曼一监ig丛曼鱼.鱼!.鱼曼n星坠P堡墨墅Q卫立煎亟硕士研究生墨菱亟指导教师叠至墼握论文提交日期工剑啕丛山文答辩日期j型型罄丛虹论文评阅人答辩委员会主席绻瘗.丝荛拯鱼遮叁望2012年05月26日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重麽整皇盔堂或其他教育机构的学位或证书而使用过

2、的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:、/弓伤,两签字日期:础7)年彳月#Et学位论文版权使用授权书本学位论文作者完全了解重麽邮电盔堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重压邮电丕堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:j珊,嗣签字日期:9,o1),年彳月名日导师签名:签字日

3、期—l刀俨扇易曰重庆邮电大学硕士论文摘要随着基因芯片技术的广泛应用,基因表达数据呈爆炸式增长,如何从该海量数据中获取有生物学意义的信息已成为生物信息学研究的热点。功能相近的基因通常具有相似的表达模式,因此,可以通过相似表达模式的发掘来预测基因的功能。聚类算法在处理基因表达数据时,可以将具有相似表达模式的基因聚为一类,据此推测基因的功能和发现基因间的相互关系。但是,基因问的相互关系非常复杂:基因往往具有多种功能、参与多个过程,从而基因表达数据是“高度关联的”,类簇也是高度交叉的,一个类簇可以嵌入另一个类簇中。硬聚类的单一划分忽略了这一多样性,

4、所以常采用模糊聚类分析来进行基因表达数据研究。传统的模糊聚类算法本身是一种主观性非常强的算法,且不考虑基因表达数据各维属性对聚类的不同贡献。选择不同的聚类算法,或者对一种聚类算法设定不同的起始点或簇数,都会导致不同的聚类结果。由于数据集可能来自不同的观测角度和观测人员,以及不同样本存在的关键性基因、关键性条件和噪音的差异,使得基因表达数据各维属性对聚类的贡献是不同的,若不考虑这种差异将会影响到聚类的精度。另外,传统的模糊聚类算法不考虑基因之间的相互关联性,使得聚类结果不具备很好的生物学意义。因此,需要进一步对算法进行改进。针对目前基因表达数

5、据模糊聚类分析中存在的问题,本文主要做了如下两部分工作:第一部分,首先引入一种数据集预处理方法,主要目的是解决FCM算法应用于基因表达数据分析时存在的初始值敏感性和参数依赖性问题。预处理算法基于类间熵寻找数据集的实际分类数目和代表点,并将其作为后续FCM算法的输入参数。然后基于信息熵求得基因表达数据各维属性的特征权重向量,最后将权重向量引入FCM算法。实验表明,新算法提高了聚类结果的稳定性和精度。第二部分,基于互信息求各维属性的特征权重,以此来解决FCM算法的聚类结果不具备很好的生物学意义这个问题。重点阐述了基于互信息获取基因表达数据特征权

6、重的详细步骤,并通过实验验证了基于互信息特征加权的FCM算法使聚类结果具有很好的生物学意义且提高了聚类精度。关键词:基因表达数据,模糊聚类,特征加权,信息熵,互信启重庆邮电大学硕士论文AbstractWiththewideapplicationofgenechip,genome-wideexpressiondataisexplosivelygrowing,SOhowtoexcavateinformationwithbiologicalsignificancefromthismassivedatahasbecamethehotspotrese

7、archofbioinformatics.Geneswithsimilarfunctionnormallyhavesimilarexpressionpatterns,therefore,genes’functionscanbepredictedbyexcavatingthesimilarexpressionpatterns,Clusteringalgorithm,asoneofthemainalgorithmsintheresearchofgeneexpressiondata,canclustergeneswithsimilarexpres

8、sionpatternstogether,accordingwhichresearcherscaninferredgenes’functionsanddiscovertherel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。