欢迎来到天天文库
浏览记录
ID:54017479
大小:246.12 KB
页数:5页
时间:2020-04-28
《定向判别分析新算法及应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、CN43-1258/TP计算机工程与科学2006年第28卷第9期iSSN1007-130XCOMPUTERENGiNEERiNGSCiENCEVol.289No.992006=================================================文章编号:1007-130X(2006)09-0077-03定向判别分析新算法及应用eANewAlgorithmforDirectionalDiscriminantAnalysisanditsApplication丁跃潮9万春9孙扬DINGyue-chao9WA
2、NChun9SUNyang(集美大学计算机工程学院9福建厦门361021)(SchoolofComPuterEngineering9JimeiUniversity9Xiamen3610219China)摘要:本文介绍了多元有序数据定向判别分析新方法的原理!建模流程!应用流程和应用实例"这种判别分析将分类建模与判别归类分开"新方法用多组或逐步判别分析对多元有序数据建模#应用时根据应用领域的知识对样本归属作初步定向#然后选择模型的相关局部进行判别归类"这种方法解决了由于时间序列多元数据周期性造成的样本分类颠倒问题"Abstract:
3、Thispaperintroducestheprinciple9modelingflowchart9applicationflowchartandapracticalexampleofanewalgorithmcalledDirectionalDiscriminantAnalysis(DDA)9whichmaybeusedinmultivariateseCuencedata.inDDA9classmodelinganddatadiscriminatingareseparated.Themodelformultivariatese
4、Cuencedataisbuiltbymultipleorstep-wisediscriminantanalysis.inapplyingthemodel9theinitialestimationofthesamplesclassificationshouldbegivenac-cordingtotheknowledgeintheapplicationfield.Thentheprogramselectstheappropriatepartofthemodeltodiscriminatetheclassesofthedata.i
5、nthisway9wecansolvetheupsidedownproblemofsampleclassificationcausedbytheperiodicityofmultivariatetimeseriesdata.关键词:判别分析$多元数据$定向判别$建模$最优分割Keywords:discriminantanalysis3multivariatedata3directionaldiscriminant3modeling3bestcutting中图分类号:TP301.6;TP311文献标识码:A维表O假设有来自G个母体
6、的n个已知分类样本9每个样本1引言有m个变量9则在数据库中加上样品标识和已知分类9共有判别分析是根据多指标来判断个体所属类别的一种多m+2个字段条记录O每个样本被看成是m维欧氏空间元统计分析方法9其本质是利用多指标进行综合判断O根R上的一个点9每个母体都是R中的一个子空间RgO这些据变量取舍情况又分为多组判别和逐步判别1~3O目前9子空间是互相排斥的9组成了RO需要找出一个办法9即找该方法在经济气象地质冶金生物农业和医学等需要到判别函数9把空间R划分为G个子空间Rg(g=19299处理多元数据的诸多领域得到广泛应用
7、O笔者在这些领域G)O已知的样本有了空间归属和函数9就能对未知归属的的应用中对逐步判别分析方法进行扩充9提出了二阶判样本进行判别9确定其归属9即判别归类或预测O别4定向判别和有序判别等新方法O这里引入其中一种人们总是希望用较少的变量去划分空间R9因为采集数新的分析方法定向判别9以解决有序样本建模分类和据记录时9字段越少9成本越低O这就需要衡量每个变量参判别预测的问题9并为数据挖掘提供新的途径O与划分G个母体的能力9因而9这就需要用F检验9给出引入变量的F值和剔除变量的F值9作为引入和剔除变量的2逐步判别分析原理简介门限值O在一
8、个母体内9样本间的差异应当较小9不同母体的样本差异应当较大O根据Wilks准则9组内离差越小9组对于一个多元数据矩阵9在数据库领域表现为多字段二间离差越大9越有利于G个母体的分类O通过计算组间离e收稿日期:2005-09-283修订日期:2005-12-02基金
此文档下载收益归作者所有