欢迎来到天天文库
浏览记录
ID:54367081
大小:215.76 KB
页数:6页
时间:2020-04-29
《基于模糊核判别分析的基因表达数据分析方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第35卷增刊I华中科技大学学报自然科学版Vol.35Sup.IZ007年3月J.HuazhongUniv.ofSci.Tech.NatureScienceEditionMar.Z007基于模糊核判别分析的基因表达数据分析方法周晓彦1!ZZ郑文明!1南京信息工程大学电子与信息工程学院"江苏南京Z10044#Z东南大学学习科学研究中心"江苏南京Z10096$摘要!针对基因表达数据空间分布的特性提出了一种基于模糊核判别分析的基因表达数据分析方法.方法综合了模糊数学以及核判别分析方法的优点提高了对基因表达数据分类识别的准确性.以多发性骨髓瘤的基因表达数据为例进行了实验从实验
2、结果可以看出采用模糊核判别分析方法可以得到最佳的识别效果.关键词!模糊核判别分析基因表达数据生物信息学中图分类号!TP391.4文献标识码!A文章编号!1671-451ZZ007S1-0173-04Usingfuzzykerneldiscriminantanalysisfortumorclassificationwithgeneexpressiondata1ZZZhouXiao$anZhengWenming1SchoolofElectronicsandInformationEngineeringNaningUniversityofInformationScience
3、andTechnologyNaningZ10044ChinaZResearchCenterforLearningScienceSoutheastUniversityNaningZ10096ChinaAbstractTheuseofgeneexpressiondataforrecognitionhasbeenaveryactiveresearchareainbioin-formatics.InthispaperWeproposedaneffectivegeneexpressiondatarecognitionmethodbasedonafuzzykerneldiscr
4、iminantanalysisFKDAWhichisthenonlinearextensionoffuzzylineardiscrimi-nantanalysisFLDAviathekerneltrick.ComparedWiththetraditionalkerneldiscriminantanalysisKDAmethodtheproposedFKDAmethodismorepoWerfulintermsofthegeneralizationabilitybyprovidingafuzzygradeforeachtrainingsample.Weconducte
5、xperimentsontheWell-knoWnacuteleukemiadatasetandtheexperimentalresultsshoWthattheproposedmethodcanachievethebestper-formanceamongfourcommonlyusedrecognitionmethods.Keywordskerneldiscriminantanalysisgeneexpressiondatabioinformatics核判别分析KDA或称广义判别分析每个样本Xj以二值化形式属于这C类样本集.但1GDA是由Baudat等人于Z00
6、0年提出的一种是在许多实际问题中这种类别标记法并不能很非线性特征提取方法.该方法通过核技巧对线性好地反应出样本的分布特性.例如在面部表情识判别分析LDA进行非线性扩展.同LDA相比别中一幅表情图像往往同时含有6种强度不同KDA最大的优点是能够有效地提取训练数据的的基本情绪特征快乐悲伤惊讶生气沮丧和非线性特征因而对于线性不可分的分类问题Z恐惧.在这种情况下采用模糊分类的方式来KDA方法将取得比LDA更好的分类效果.KDA进行类别标记能更好地反映出表情的类别特性.方法是在假设各个训练样本仅属于某一类样本集对此本文在参照KWak等人提出的模糊Fisher-3的条件下得到的
7、即对于C类样本集KDA假设face方法的基础上提出了模糊KDAFKDA收稿日期!Z006-1Z-1Z.作者简介!周晓彦1980-女博士研究生南京南京信息工程大学电子与信息工程学院Z10044.E-mailWenming-zheng@seu.edu.cn基金项目!国家自然科学基金资助项目605030Z3江苏省自然科学基金资助项目BKZ005407江苏省图像处理与图像通信重点实验室开放课题资助项目ZKZ05013.-174-华中科技大学学报自然科学版第35卷方法9并应用于由DNA芯片产生的基因表达数很好地反映出数据的空间分布特性.在这种情况4~6据的分析中.下9最好
此文档下载收益归作者所有