数据挖掘：数据挖掘(data mining)在体育统计中的应用

ID：34405109

大小：184.20 KB

页数：4页

时间：2019-03-05

资源描述：

《数据挖掘：数据挖掘(data mining)在体育统计中的应用》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、维普资讯http://www.cqvip.com第23卷第2期东华理工学院学报(社会科学版)Vo1．23No．22004年6月JOURNALOFEASTCHINAINSTITUTEOFTECHNOLOGYJun．2004数据挖掘(DataMining)在体育统计中的应用郝丽，刘乐平，王星2(1．东华理工学院，江西抚州344000；2．中国人民大学，北京1~872)摘要：数据挖掘是当今信息技术领域中最热门话题之一。20世纪90年代，人们在数据库基础上提出建立数据仓库，应用机器学习和统计分析相结合的方法处理数据，这两者的结合促成数据

2、挖掘技术的诞生。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。文章简要介绍数据挖掘的思想、方法和技术，讨论了数据挖掘对现代统计学发展的影响，最后，通过应用实例分析和讨论了数据挖掘在体育统计中的应用。关键词：体育统计；数据挖掘；知识发现中图分类号：G80．32文献标识码：A文章编号：1001—635X(2004)02—0092—04本文以网上收索(EBSCO、Google、中国期刊中，即使是最先进的搜索引擎也只能从1／3可以索网)为主，

3、图书馆文献查阅为辅，广泛收集“数据挖引的WEB站点中获取信息。这样，面对这种“数据掘”的有关资料。在此基础上，首先简要介绍数据过剩”和“信息爆炸”的局面，奈斯伯特(JohnNais—挖掘的思想、方法和技术，然后讨论了数据挖掘对bett)惊呼“我们被信息所淹没，但却忍受着知识的现代统计学发展的影响，并通过具体的应用实例分饥渴’’⋯。析和研究了数据挖掘在体育统计中的应用，旨在为面临浩渺无际的数据，人们呼唤从数据汪洋中体育科学研究提供一种新的研究思路和方法。出现一个去粗存精、去伪存真的技术。从数据库中发现知识及其核心技术——数据挖掘(

4、DM：Data一、数据挖掘的思想、方法和技术Mining)便应运而生了。(一)“信息爆炸”与“知识贫乏”(二)数据挖掘(DataMining)随着数据库技术的成熟和数据应用的普及，人数据挖掘是当今信息技术领域中最热门话题类积累的信息量正在以指数速度迅速增长。进入之一。2O世纪9O年代，人们在数据库基础上提出9O年代，伴随着因特网的出现和发展，整个世界正建立数据仓库，应用机器学习和统计分析相结合的被联接成一个小小的地球村，人们可以跨越时空地方法处理数据，这两者的结合促成数据挖掘技术的域在网上交换数据信息和协同工作。这样，展现在诞生

5、。Fayyad，Piatetsky—Shapiro和Smyth于1997人们面前的已不是局限于某一个国家、某一个地区年指出：“知识发现(KnowledgeDiscoveryfromData—和某一个部门的数据库，而是浩瀚无垠的信息海bases，简称KDD)是从数据库中发现知识的全部过洋，数据洪水正向人们滚滚涌来。大量信息在给人程，而数据挖掘则是此过程中的关键步骤”。们带来方便的同时也带来了许多问题：信息过量，数据挖掘就是从大量的、不完全的、有噪声的、难以消化；信息真假，难以辨识；信息安全，难以保模糊的、随机的实际应用数据中，提取

6、隐含在其中证；信息形式不一致，难以统一处理。当数据量极的、人们事先不知道的、但又是潜在有用的信息和度增长时，如果没有有效的方法，由计算机及信息知识的过程。何为知识?从广义上理解，数据、信技术来提取有用信息和知识，人们也会感到面对信息也是知识的表现形式，但是人们更把概念、规则、息海洋像大海捞针一样束手无策。在信息的海洋模式、规律和约束等看作知识。人们把数据看作是收稿日期：2004-02-20基金项目：江西省教育科学“十五”规划课题(YB294)，教育部人文社会科学重点研究基地2001年度重大研究项目(01JAZJDgl0001)作

7、者简介：郝丽(1966一)。女，安徽寿县人，副教授，主要从事心理健康理论研究。维普资讯http://www.cqvip.com第2期郝丽等：数据挖掘(DataMining)在体育统计中的应用93形成知识的源泉，好像从矿石中采矿或淘金一样。基于事例的推理技术：这种技术的思路非常简原始数据可以是结构化的，如关系数据库中的数单，当预测未来情况或进行正确决策时，系统寻找据；也可以是半结构化的，如文本、图形和图像数与现有情况相类似的事例，并选择最佳的相同的解据；甚至是分布在网络上的异构型数据。发现知识决方案。的方法可以是数学的，也可以是非

8、数学的；可以是遗传算法技术：遗传算法是一种全新的最佳化演绎的，也可以是归纳的。发现的知识可以被用于空间搜寻法，其主要目的是以严密而具体的科学方信息管理，查询优化，决策支持和过程控制等，还可法解释自然界中“物竞天择、适者生存”的演化过以用于数据自身的维护。程，将生

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

数据挖掘：数据挖掘(data mining)在体育统计中的应用

数据挖掘：数据挖掘(data mining)在体育统计中的应用

相关文章

相关标签