欢迎来到天天文库
浏览记录
ID:36630392
大小:1.57 MB
页数:54页
时间:2019-05-13
《数据挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大连海事大学硕士学位论文数据挖掘算法研究姓名:李安申请学位级别:硕士专业:应用数学指导教师:刘晓东2003.3.1,摘要l数据撼握楚近几年的~个热门名词,糖从巨大的馈息仓库中揭示出来被人知懿关系农模式,蘩霸金鼗减少不宓要投资懿冠时摄毫烫垒露掇。嚣由予A类熟识静圈弯特点帮楚它懿不是全蛙莓珏不确嶷憋,因凝嚣致褒数据添中,攘凝性信息秘禳糕谴璃穗隧始霹凳。稿瘸传统敬分毒秀方法绞罐察决这耪模霸淫禳念,露模糊数学分掰方法芷翳籁决了这个海题。近凡年来,模糊理论在数掇拯镶方甏肖蓑i“泛应用,箕缑多产晶已经投入社会中,产生了巨大静社会
2、效益。罗●,本文主要磷究工羚如下:f1)分缓了数摄挖掘瓣襁关知识和模糊数学的稚关理论秘概念,在此蘩础上奔缨了一耪基予AFS璎谂瓣方法。f2)对鏊予AFS疆埝瓣器l代数豹除数遴露了磺突,在韭l基破上对El代数豹除数给斑了一令下器嵇计,著褥赉了残代数熬簸大玲。$)褥蒸子AFS壤论憋方法与嚣i找数瓣狳数、Ej筏数豹最大瓣籀结合,对实际问越避章亍了分析研究。f4)对数据挖掘中鬻免的凡类英纯数学方法避行了分攒探讨,并且潦遂望方法斑用于实际中。美键漏数掇癌矿樱蟋磊AFS囊衫’EI徒∥”EI代数豹阶数父AbstractDatami
3、ningisafrequentwordinresentyears,whichmeanstoopenoutunknownrelationsandpatternfromenormousinformation-warehouseandhelpcorporationsreduceunnecessaryinvestandincreacereturnoffunds.Becausethecharacteristicsofhuman’Sknowledgeareincompletenessanduncertain,fuzzyinfor
4、mationandfuzzyattributeisfrequentindataSOurce。It’Sdifficulttosolvethiskindoffuzzyconceptusingtraditionalanalysismethods,buttheanalysismethodoffuzzymathematicsmaysolvetheproblemonthebeam,Fuzzytheoryisusedwidelyindataminingfieldandmanyproductsbasedonfuzzytheorybr
5、inghugesocialbenefit.Theprima,researchworkofthepaperisasfollows:(1)Introducecorrelativeknowledgeofdatamining,mlaionaltheoryoffuzzymathematicsandakindofanalysismethodbasedonAFStheory.(2)StudyordersofAFStheorybasedonAFStheoryandgetaminimumboundaryaboutordersofEIa
6、lgebraandgetthemaximumrankofEIalgebra.<3)StudythepracticeproblemscombiningthemethodbasedofAFStheorytoEIalgebraandapplyAFStheorytostudypracticeproblems.(《)Analyseanddiscussthefamiliarmathematicsmethodsindataminingfieldandapplythemtopractice.KeyWords:DataMLningFu
7、zzyTheoryAFSTheoryEIAlgebraOrdersofEIAlgebra{i引言随着数据库技术的迅遮发展以及数攒库管理系统的广泛应用,人们积累的数据越来越多。人们希望将这些数搬转换成有用的信息和知识,以便更好地利用遮些数据,髑予决袋。当裁的数摆黪系统可鞋毫效地实现海蟹数据瓣录入、套询、统计等功能,但无法发现海量数据背后隐藏的具商决策意义的知识,如关系和模式,无法寝据瑶露静数疆颟溅未来懿发袋趋势。囊予鲮乏挖搀数壤鹜蜃戆藏豹簸识的手段,导致了“数据爆炸但知识贫乏”的现象。面对“被数据淹没,却饥饿予知识”的
8、挑酸,数据挖箍藕鲡识发现(DataMiningandKnowledgeDiscovery,DMKD)技术应运嬲生,并得以蓬勃发展,越来越屡示出其强大的生命力。数据挖掘(DataMining)就是从大量的、不完全晌、有嗓声的、模糊的、随机的数据中,提取隐含在其中约、人们枣先不知道的、僵又是潜在有闵的信爨鞠知识的过程。它是数攒库研究中的一个很有应用
此文档下载收益归作者所有