基于遗传算法的双向聚类分析研究

基于遗传算法的双向聚类分析研究

ID:33234584

大小:2.02 MB

页数:89页

时间:2019-02-22

基于遗传算法的双向聚类分析研究_第1页
基于遗传算法的双向聚类分析研究_第2页
基于遗传算法的双向聚类分析研究_第3页
基于遗传算法的双向聚类分析研究_第4页
基于遗传算法的双向聚类分析研究_第5页
资源描述:

《基于遗传算法的双向聚类分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA硕士学位论文MASTERDISSERTATION论文题目基于遗传算法的双向聚类分析研究学科专业计算机软件与理论指导教师刘勇国教授作者姓名唐恒学号200820602086I万方数据分类号密级注1UDC学位论文基于遗传算法的双向聚类分析研究(题名和副题名)唐恒(作者姓名)指导教师姓名刘勇国教授电子科技大学成都(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业名称计算机软件与理论论文提交日期2011.4论文答辩日期2011.5学位授予单位和日期

2、电子科技大学答辩委员会主席评阅人2011年月日注1:注明《国际十进分类法UDC》的类号。万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁

3、盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:年月日I万方数据摘要摘要微阵列技术是实验分子生物学最新的重大突破之一,作为一个强有力的工具,它可以同时得到上千个基因的表达水平,产生大规模基因表达数据。由于在基因表达分析中有巨大的潜力,有助于病情诊断、新药开发和生命科学研究,自双向聚类算法被提出开始,它便被广泛应用于基因表达数据研究中,但现有的算法都还存在一些不足,因此研究双向聚类算法非常必要。

4、本论文应用遗传算法来解决双向聚类问题,提出了一种改进SGBI(SequentialGeneticBiclustering)算法,它采用连续覆盖策略来搜索双向聚类,通过避免重叠策略来尽可能避免结果双向聚类间的重复,将种群分为两部分进化以平衡种群的选择压力和种群多样性,主要包括以下几个方面:1.算法使用了基于遗传算法的连续覆盖策略。连续覆盖策略连续执行最优搜索模块,它将基因表达矩阵和某个给定阈值作为输入,随机产生初始群体,并通过适应度函数的引导,按照适者生存的原理,重复执行选择、交叉、变异等遗传操作来进化,获得平均平方残差低于给定阈值的双向聚类作为结果。2

5、.利用避免重叠策略来改善双向聚类算法的迭代过程。没有使用随机数来覆盖已发现双向聚类,而是在每次获得结果后调整基因表达矩阵的惩罚值权重来尽可能避免结果间的重复,避免了其他算法中存在的随机数干扰问题,有效控制了结果双向聚类间的重叠率。3.根据种群内个体到当前最优个体的距离,把种群分成两部分,分别按照不同的进化策略执行进化操作,然后重组,有效地地平衡了种群的选择压力和种群多样性。改进SGBI算法被应用于酵母菌基因表达谱数据集、人类细胞表达谱数据集、肿瘤基因表达谱数据集上,成功地获得了在条件子集下表现出明显相似变动趋势的基因子集,表明改进SGBI算法能够获得规模较

6、大并且平均平方残差低于给定阈值、行变动相对较高、相互间重叠率较低的双向聚类,说明了算法的有效性。关键词:基因表达数据,双向聚类算法,遗传算法,惩罚策略,分群进化策略I万方数据ABSTRACTABSTRACTMicroarraystechnologyisoneofthelatestbreakthroughsinexperimentalmolecularbiology.Itcansimultaneouslymonitortheexpressionvaluesofthousandsofgenesandthenproducehugeamountofvaluabl

7、eexpressiondata.Becausetheenormouspotentialingeneexpressionprofilingisimportantforthediseaseprognosis,newdrugdevelopment,lifescienceresearchandsoon,sincethebiclusteringalgorithmhasbeenproposed,itiswidelyusedingenomicresearchofgeneexpressiondata,Butthevariousproposedbiclusteringalg

8、orithmsstillhavesomeshortcomings,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。