基因微阵列数据特征选择与分类方法研究

基因微阵列数据特征选择与分类方法研究

ID:27335096

大小:4.25 MB

页数:81页

时间:2018-12-02

基因微阵列数据特征选择与分类方法研究_第1页
基因微阵列数据特征选择与分类方法研究_第2页
基因微阵列数据特征选择与分类方法研究_第3页
基因微阵列数据特征选择与分类方法研究_第4页
基因微阵列数据特征选择与分类方法研究_第5页
资源描述:

《基因微阵列数据特征选择与分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10289 类号:TP391 密级:公开基因微阵列数据特征选择与分类方法研究学号:092070036江苏科技大学硕士学位论文基因微阵列数据特征选择与分类方法研究黄丹凤研究生姓名黄丹凤导师姓名祁云嵩申请学位类别全日制硕士学位授予单位江苏科技大学学科专业计算机应用技术论文提交日期2012年3月10日研究方向生物信息学论文答辩日期2012年3月17日答辩委员会主席王直评阅人江苏科技大学2012年3月18日分类号:TP391密级:公开学号:092070036工学硕士学位论文基因微阵列数据特征选择与分类方法研究学生姓名黄丹凤

2、指导教师祁云嵩副教授江苏科技大学二O一二年三月AThesisSubmittedinFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchonGeneSelectionandClassification ofDNAMicroarrayDataSubmittedbyHuangDan-fengSupervisedbyProfessorQiYun-songJiangsuUniversityofScienceandTechnologyMarch,201

3、2摘要江苏科技大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:年月日I江苏科技大学工学硕士学位论文江苏科技大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅

4、和借阅。本人授权江苏科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于:(1)保密□,在年解密后适用本授权书。(2)不保密□。学位论文作者签名:指导教师签名:年月日年月日II摘要摘要DNA微阵列又称基因芯片,是二十世纪九十年代发展起来的具有里程碑意义的生物学技术,通过对不同样本(时间、环境等)下的基因表达模式进行分析可提取重要信息。至今为止,该技术已经在基因发现、疾病诊断、药物发掘、药理研究等多个领域得到广泛应用并有着光辉的发展前景。目前,科

5、学家们正积极结合多学科知识工具来提取基因表达数据中所包含的生物学意义。鉴于实验环境及成本的限制,DNA微阵列数据具有高维小样本,存在冗余基因与噪声基因等特点,如何高效准确地从DNA微阵列数据中发掘有用的信息,是当前机器学习和数据挖掘领域亟待解决的问题之一。成功的特征选择和分类算法是微阵列数据分析的关键,本文围绕基因表达数据的特征选择和分类任务展开研究,主要研究成果如下:1.基于粗糙集分辨矩阵理论提出了一种新的基于类可分性判据的特征选择方法,其主要思想是显著性较高的特征能划分较多的不同类,聚集较多的同类样本。2.提出了基于模糊

6、相似系数和粗糙集的基因选择方法,将基于类可分性判据的算法用于DNA微阵列数据分析,对原信息系统构造相似矩阵和新信息系统来选择特征基因组,避开了离散化过程,减少了信息损失。3.研究了一对多支持向量机,一对一支持向量机等现有多类分类方法,分析了它们在解决多类问题时的优缺点。4.结合改进的最短距离法与超球体最小包含法,提出了一种基于二叉树结构的支持向量机多类分类器,使用参数方式调整样本分布范围与类间距离权重,据此调整二叉树结构。论文利用研究成果针对人脑肿瘤,白血病等多个数据集进行了基因选择和分类实验。实验表明,采用论文研究的方法进

7、行DNA微阵列数据基因选择和分类,分类准确度和效率都具有较大优势。关键词DNA微阵列;特征选择;粗糙集;分辨矩阵;支持向量机;多类分类I江苏科技大学工学硕士学位论文IIAbstractAbstractDNAmicroarray,alsocalledgenechip,ismostsignificantmilestonetechnologydevelopedsince90s’twentycentury,whichcouldanalyzethemodeofgeneexpressionfromdifferentsamples(tim

8、e,atmosphere,etc)toobtainimportantinformation.Assofar,thetechnologyhasbeenwidelyappliedingenediscovery,diseasediagnosis,drugdiscovery,toxicologyr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。