欢迎来到天天文库
浏览记录
ID:5298254
大小:253.57 KB
页数:3页
时间:2017-12-07
《数据挖掘与统计方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、lSSN1009—3044E-mail:jslt@eccc.net.cnComputerKnowledgeandTechnology电脑知识与技术http://www.dnzs.net.enVo1.6,No.28,October2010,PP.7884—7886Te1:+86—551-56909635690964数据挖掘与统计方法龙草芳.辛玲(1.东华理大学,江西抚州344000;2.南昌3v@共青学院,江西九江330046)摘要:数据挖掘和统计学有很多共同点,但与此同时它们也有很多差异。它们的关系究竞如何?该文分别介绍了数据挖掘和统计学的含义,讨论了数据挖掘与统计学间的关系,介绍了在数据挖掘
2、中常用的统计方法和存在的问题和前景关键词:数据挖掘;统计学;统计方法中图分类号:TP391文献标识码:A文章编号:1009—3044(2010)28—7884—03DataMining&StatisticalMethodsLONGCao—fang,XINLing2(1.EastChinaInstituteofTechnology,Fuzhou344000,China;2.GongqingCoHegeofNanchangUniversity,Jiujiang330046,China)Abstract:Thedataminingandstatistichasmanycommongrounds,bu
3、ttheyalsohavemanydiferencesatthesanletime.Howabouttheirrelationsactually?Inthispapewediscusstherelationsbetweendatamimngandstatistic,andintroducetheusefulstatisticalmethodsindatamining,andgivesomeproblemsandprospects.Keywords:datamining;statistic;statisticalmethods数据作为信息的主要载体在当今信息化社会中扮演着重要的角色,各行各业的各
4、个领域无处不有数据的存在,数据为我们提供了丰富的信息。然而,如何从大量的看似杂乱无章的数据中揭示其中隐含的内在规律、发掘有用的信息以指导人们进行科学的推断与决策,还需要对这些纷繁复杂的数据进行分析。统计方法有成熟的数学基础,可以很好的对数据进行解释,在数据挖掘中有着大量的运用,包括数据挖掘中常用的统计方法:主成分分析和聚类分析。本文对数据挖掘及数据分析做了一定的研究,参考了大量相关文献,对其主要内容进行了详细的了解。1数据挖掘综述现今世界上信息总量不断增加,迫切需要有效的信息分析工具,它们能发现大量数据间隐藏的依赖关系,能从大量数据中抽取有用的信息或知识。数据挖掘就是为解决这一要求而出现的一种
5、新型数据分析处理技术。1.1数据挖掘的定义1.1.1技术上的定义从技术角度看,数据挖掘就是应用一系列技术从大型数据库或数据仓库的数据中提取人们感兴趣的信息和知识,这些知识或信息是隐含的、未知的、潜在有用的,所提取的知识表示为概念、规则、规律和模式等形式。数据挖掘作为知识发现过程的一个特定步骤,是一系列技术及应用,或者说是对大容量数据及数据间关系进行考察和建模的方法集。它的目标是将大容量数据转化为有用的知识和信息。1.1.2商业角度的定义从商业角度看,数据挖掘是新型的商业分析处理技术。他是从大型数据库或数据仓库中发现并提取隐藏在其中信息的一种新技术,帮助决策者寻找数据间潜在的关联,发现被忽略的因
6、素。这些信息和因素对预测趋势和决策行为足至关重要的。1.1.3数据挖掘与传统分析方法的区别数据挖掘与传统的数据分析f如查询、报表、联机应用分析1的本质区别是数据挖掘足在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。1.2国内外研究现状当前数据挖掘应用主要集中在电信、零售、农业、网络日志、银行、电力、生物、天体、化工、医药等方面。看似广泛,实际应用还远没有普及。而据Ga~ner的报告也指出,数据挖掘会成为未来10年内重要的技术之一。而数据挖掘,也已经开始成为一门独立的专业学科。2数据挖掘的统计方法统计学是一门对数据进行分析、处理的科学,而数据挖
7、掘是从大量的数据中挖掘出未被人们发现、但却十分有用的知识。在数据挖掘的过程中。必然要对大量的数据进行分析、处理,所以数据挖掘借用了很多统计学的方法。收稿日期:2010-08-07作者简介:龙草芳(1983一),女,江西抚州人,硕士,主要研究方向为计算机网络;辛玲(1980一),女,江西抚州人,硕士,主要研究方向为数字图像处理。7884数据库与僖息管理*一本栏目责任编辑:代影第6卷第28期(2010
此文档下载收益归作者所有