网络教育资源组织现况的分析和挖掘技术的应用

网络教育资源组织现况的分析和挖掘技术的应用

ID:22216016

大小:55.50 KB

页数:8页

时间:2018-10-27

网络教育资源组织现况的分析和挖掘技术的应用_第1页
网络教育资源组织现况的分析和挖掘技术的应用_第2页
网络教育资源组织现况的分析和挖掘技术的应用_第3页
网络教育资源组织现况的分析和挖掘技术的应用_第4页
网络教育资源组织现况的分析和挖掘技术的应用_第5页
资源描述:

《网络教育资源组织现况的分析和挖掘技术的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、网络教育资源组织现况的分析和挖掘技术的应用----网络教育论文-->网络教育资源组织现况的分析和挖掘技术的应用一、知识挖掘技术的基本概念·知识挖掘的定义知识挖掘技术,是近年来兴起于西方国家的先进的、较成熟的信息技术,代写硕士毕业论文它通过对大量的信息数据库进行操作,挖掘出潜在信息的黄金价值。美国加州理工学院喷气推进实验室与天文科学家合作开发的SKICAT(SkyImageCatalogingandAnalysisisTool)是第一个获得相当成功的数据挖掘应用,帮助科学家发现了16颗极其遥远的类星体。它还成功运用在市场营销、金融投资、产品制造、通信

2、网络管理等各个领域。知识挖掘的最新的描述性定义是:数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的模式的非平凡过程。数据是指有关事实的集合、记录和事物有关的原始信息。模式是一个用语言来表示的一个表达式,它可用来描述数据集的某个子集,这里的知识,是对数据包含的信息更抽象的描述。对大量数据进行分析的过程,包括数据准备、模式搜索、知识评价以及反复的修改求精。该过程要求是非平凡的,意思是要有一定程度的智能性、自动性(仅仅给出所有数据的总和不能算作是一个发现过程)。除了称为“知识挖掘”外,还有如下若干种称法:“数据发现”、“数据开采”、“

3、知识抽取”、“信息发现”、“知识发现”、“智能数据分析”、“探索式数据分析”、“信息收获”和“数据考古”等等。·知识挖掘的预测类型和模型知识挖掘就是要从大量的数据中找出关联和模式,进而指导我们的实践。它的预测功能是很显著的。比如,商家预测哪些顾客是“永久性”的,哪些是很可能离开的。预测的种类大致有以下三种:A.分类,即确定某个事件的门类性或者是阶层性的归属。B.回归,即对一个变量的质的测定。C.如果该变量是与时间相联系连续变化的,那就要用时间序列预测。知识挖掘的模式和算法也丰富多样,各有各的长处:A.神经网络模式:采用仿生物的方法,通过学习待分析数

4、据中的模式来构造模型,一般可对隐类型进行分析,用于非线性复杂的数据。神经网络由神经元的互连或按层组织的结点构成。通常的组成层次有:输入、中间和输出层。目前的三大神经网络模型有前馈式、反馈式、自组织。前馈式网络多用于预测、模式的识别,反馈式多用于联想记忆和优化计算,自组织多用于聚类。B.决策树模式:采用分支方法加上赋值的运算来得到结果。这可不是简单的分支,能在决策树中运用的算法有很多种,包括CHAID(Chi-squaredAuto-maticInteractionDetection)、CART(ClassificationAndRegression

5、Trees)、Quest等。因为分支的关系,所以决策树在决定分支的距离(分支间的差异)时最关键。此种模式多用在分类预测中。C.适合多变量的回归模式(MultivariateAdap-tiveRegressionSplines):对于涉及到多个变量,特别是变量的作用由不连续的数据的分析最得心应手。D.规则归纳模型(RuleInduction):决策树是按照一些与结构有关的规则来分支,但规则归纳法可以有与树状结构不相关的规则来对数据进行分类处理,它的规则可以不像决策树那样地严密和全面,也可以不具有层次性。它能找到不同的有时候还更好的分类方式。E.逻辑回

6、归模型:此模型是对线形回归的普遍化,主要用于预测双元体(如对或错、0或1),偶尔用在多层的变量上。F.遗传规则模型:它是模拟生物进化过程的算法,由三个基本算子组成。分别是繁殖(选择),即从一个生命力强的个体产生种群的过程;交叉(重组),即选择两个不同个体进行交换形成新个体;变异(突变),即对某些个体的某些基因进行变异得到不同的个体。除上述之外还有K-nearestNeighbor、Memory-basedReasoning、GeneralizedAdditiveModels、Boosting等模式和算法,极大地增加了知识挖掘技术实力,使其挖掘的结果

7、更能指导我们的具体实践。·知识挖掘的步骤知识挖掘是一个怎样的数据处理过程呢?这里先用图形简洁地介绍一下,具体将在第三部分展开。知识挖掘成功有两个重要的因素,一是对遇见问题的信息的精确把握;二是用正确的数据,这又包括两层含义,一是数据本身的真实可靠性,二是数据对模型的适合度要高。二、网络教育资源组织现况的分析目前网络上的教育资源非常丰富,这些资源包括了电子书、电子期刊、虚拟软件库、虚拟图书馆、电子百科、新闻组、数据库、教育网站等。笔者这里讨论的网络教育资源主要是指教育网站和数据库。·资源的组织分类A.从教育资源的物理存放位置着手,可分为本地、导航和泛

8、在资源三种。本地资源有精心的策划和组织,是学习的核心材料,但它的缺陷是本地的资源存储能力对资源广度的限制性。随着本地的概念

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。