欢迎来到天天文库
浏览记录
ID:28048722
大小:56.05 KB
页数:10页
时间:2018-12-07
《基于c45决策树算法的网络学习行为研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于C4.5决策树算法的网络学习行为研究摘要网络学习行为研究,是网络教育研究的重要组成部分。采用先进的人工智能技术对网络学习者的行为特征进行智能评价和预测,成为一个新兴交叉研宄领域。采用C4.5决策树算法构建网络学习者行为特征系统,挖掘行为特征和学习效果关系的历史数据,建立学习效果-行为特征智能评价模型。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。关键词C4.5算法决策树网络学习行为中图分类号:TP311.13文献标识码:A0引言网络学习系统以其开放的网络平台、多媒体数字化的
2、学习资源、灵活自主的学习方式为人们提供了一种新型的学习平台,可以满足不同的学习者在不同的学习时间的个别化学习的需求。但大多数只是将教学资源放到了网络上,没有考虑到学习者的个性化特征。师生之间缺乏交流和反馈功能,教师难以对学生学习的过程进行控制,而学习者自己由于能力所限,也难以对学习过程进行自我控制,导致学习者信息迷航、基于C4.5决策树算法的网络学习行为研究摘要网络学习行为研究,是网络教育研究的重要组成部分。采用先进的人工智能技术对网络学习者的行为特征进行智能评价和预测,成为一个新兴交叉研宄领域。
3、采用C4.5决策树算法构建网络学习者行为特征系统,挖掘行为特征和学习效果关系的历史数据,建立学习效果-行为特征智能评价模型。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。关键词C4.5算法决策树网络学习行为中图分类号:TP311.13文献标识码:A0引言网络学习系统以其开放的网络平台、多媒体数字化的学习资源、灵活自主的学习方式为人们提供了一种新型的学习平台,可以满足不同的学习者在不同的学习时间的个别化学习的需求。但大多数只是将教学资源放到了网络上,没有考虑到学习者的个性化特征。
4、师生之间缺乏交流和反馈功能,教师难以对学生学习的过程进行控制,而学习者自己由于能力所限,也难以对学习过程进行自我控制,导致学习者信息迷航、情绪低下、学习热情衰减等问题,严重影响学习效果。因此,师生双方都迫切希望能够建立提供个性化的推荐和指导的学习系统。个性化指导的本质就是根据不同学生的个性特征提供有针对性的服务。因此,其最基本也是最首要的问题就是如何对学生的行为进行分析,并从中挖掘学生的学习特征。学习者的个性特征直接影响着学习者的学习行为和学习效果。本文研宄决策树方法的经典算法C4.5算法,将其应
5、用于网络学习者的网络学习行为,建立数据挖掘模型,合理将网络学习者分类,进而改进网络学习系统的设计方案。1C4.5决策树算法决策树是判断给定样本与某种属性相关联的决策过程的一种表示方法,从数据中生成分类器的一个特别有效的方法是生成一颗决策树,该方法广泛应用于数据挖掘和机器学习等领域,用来解决与分类相关的问题。决策树表示法是应用最广泛的逻辑方法。目前生成决策树方法的算法主要有三种:CART算法,ID3算法,C4.5算法。其中C4.5算法具有分类速度快且精度高的特点,是发展得比较完善的一种决策树算法。C
6、4.5算法是构造决策树分类器的一种有效算法,并最终可以形成产生式规则。C4.5算法的输入是一张关系表,由若干不同的属性及若干数据元组(称为训练样本)组成。属性分为两部分:一部分作为判定对象属性(判定树中的非叶节点);另一部分作为分类对象属性(判定树中的叶节点)。C4.5算法采用信息熵的方法,比较各个判定对象属性的信息增益率的大小,选择信息增益率最大的属性进行分类,递归生成一个判定树。设
7、S
8、为训练集S的样本总数,共有m类样本Ci(i=l,2,3,…,m,),
9、Ci
10、为类Ci中的样本数,设Pi=
11、C
12、i
13、/
14、S
15、是任意样本属于Ci的概率,训练样本分类属性的总信息熵E(Sl,S2,…,Sm)的计算公式为:E(Sl,S2,…,Sm)=-(pi*log2(pi))公式(1)设属性A具有v个不同值{al,a2,…,av},可以用属性A将S划分为个子集{Sl,S2,…,Sm},其中Si包含S中这样一些样本,它们在A上具有值aj(j二1,2,…,v)。设
16、Sij
17、为Si类中Cj的样本数,以属性A为分类所需的期望熵E(A)的计算公式为:E(A)=(
18、Slj
19、+
20、S2j
21、+-+
22、Smj
23、)*E(Slj,S2j
24、,…,Smj)/
25、S
26、……公式(2)属性A相对于类别集合C的信息增益Gain(C,A)的计算公式为:Gain(C,A)=E(SI,S2,Sm)?HaE(A)公式(3)属性A相对于类别集合C的信息增益率GainRatio(C,A)的计算公式为:GainRatio(C,A)二Gain(C,A)/E(Slj,S2jSmj)公式(4)2C4.5算法在个性化网络学习中的应用2.1问题定义与数据预处理网络学习行为的评定,一方面要根据网络学习者的的学习基础,同时还要结合每位学习者的具体表现和实际
此文档下载收益归作者所有