机器学习算法:j48和jrip

机器学习算法:j48和jrip

ID:33546377

大小:471.88 KB

页数:4页

时间:2019-02-27

机器学习算法:j48和jrip_第1页
机器学习算法:j48和jrip_第2页
机器学习算法:j48和jrip_第3页
机器学习算法:j48和jrip_第4页
资源描述:

《机器学习算法:j48和jrip》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、维普资讯http://www.cqvip.com电子产品可靠性与环境试验分类算法的分析与比较★陈媛媛.彭新光太原理工大学计算机科学与挂术系.山西太原030024摘要:在全面综述通用毫『L器学习归纳分类算法的基础上,采用算法分类机制分析的方括,从预涮精度、学习效率、健壮性等方面对决策村和规则归纳分类算法进行睬人的分析和比较研究,为在不同的应用领域选择最优分类算法奠定了基础。由于R【PPER分类算法采用了重复增量裁减机制,所以在计算复杂性、分类精度、噪音数据适应性等方面都优于其它分类算1哇,更适用于入侵检测建攘使用关键词:机器学习;分类算法:

2、入侵检测中图分类号:rI’P301.6文献标识码:A文章编号:1672-5468(2oo4)06--0072—o4AnalysisandcomparisonofclassificationalgorithmsCHENYuan—yuan,PENGXin—gum~g(DepartmentofComputerScience&n(】Teehno]ogyofTUT,Taiyuan030024,China)Abstract:ItsummarizesIhemainfeat,Iresofdex.isiontreelearningalgorilhmandr

3、ulelearningalgorithmbyin—depthanalysisandcomparisonfromallaspectssuchaspredictionaccuracylearningefficiencyandrobustness.ItisshownthatRIPPERissuperiortootheralgorithmsintermsofcomplexityincomputation,classifiedpreeisiO13andnoisydataadaptahilitybecauseofitsadoptionoftherep

4、eatedincrementalreductionmechanism,anditismoresuitabletotheintrusiondetection.Keywords:machinelearning;classificationalgori山m;intrusiondetection1引言分类规则描述。在测试阶段利用分类规则进行精度测试,然后用于对实际数据集中的数据记录分类就是在已有数据的基础上学习一个分进行分类一般来说,测试阶段的代价远远低于类函数或构造一个分类模型.即我们通常所说的圳练阶段本文主要采用算法分析的方法来比较分类器(C

5、lassifier)。该函数或模型能够把数据库不同的分类算法,分析过程中主要用到下列指标:巾的记录映射到给定类别中的某一个从而应用1)预测精度:分类器正确预l蜊新的或先前未于数据预测。构造分类器的过程一般分训练丰钉测见过的数据类标的能力;试两个阶段在训练阶段.分析训练数据集中数2)学习效率:产生和使用分类器的时间;据记录的特征属性,为每种类型标识生成精确的3)健牡性:给定噪声数据或具有空缺值的数★基金项目:山西省自然科学基金项目(2004l047)责助收稿日期:2004_09—0l作者简介:陈斌谩(1980-),士.山西省交城县人,太朦理

6、工大学计算机科学与技术系硕士砰览生.研究方向为机器学习与网络安奎。维普资讯http://www.cqvip.com第6期陈媛媛等:分类算法的分析与比较据。分类器正确预测的能力。2.2SLIQ算法这些指标较全面地反映了归纳分类算法的性SLIQ算法在决策树构造过程中,采用了“预能。这里主要针对目前广泛使用的决策树和规则排序”和“广度优先”两种技术,可以处理符号分类算法进行分析与比较。值和连续值。2决策树分类算法决策树构造过程中要选择最优属性,必然要对训练集中属性的取值进行排序,而排序很耗费决策树方法起源于概念学习系统(CLS:时间。SLIQ算

7、法采用了预排序技术,把所有记录ConceptLearningSystem)。然后发展了ID3方法并按照每个属性的取值从小到大进行排序,消除了达到高峰。最后又演化为能处理连续属性的C4.5决策树每个节点都要进行数据集排序的要求。实【l】数据挖掘研究兴起之后,为了适应大规模数据。现时.需要为训练集数据的每个属性创建一个属集的处理,对它又进行了改进,其中SLIQ2】性列表。为每个元组的类别创建一个类别列表。算(SupervisedLearningInQuest)是比较有代表性的法实现时需要足够的内存来保存类别列表。在C45算法。中。树的构造是按

8、照深度优先策略完成的,需要2.1C4.5算法对每个属性列表在每个节点处都进行一遍扫描,费时很多。SLIQ采用广度优先策略构造决策树,C4.5算法构造决策树的核心思想是贪婪算法,在决策树的每一层

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。