欢迎来到天天文库
浏览记录
ID:10368156
大小:64.50 KB
页数:8页
时间:2018-07-06
《研究数据挖掘相关论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、研究数据挖掘相关论文研究数据挖掘导读:数据挖掘论文题目:数据挖掘技术在电子商务中的应用系别:计算机学院专业:11X络工程1班学生黄坤学号:指导教师:2014年11月06日数据挖掘技术在电子商务中的应用一、研究原因电子商务在现代商务活动中的正变得日趋重要,随着大数据时代的到来,商务信息显得尤为重要,在电子商务中谁掌握了有利的市场信息,谁就能在这个竞争激烈电商行业中占据绝对的优势。而数据挖掘技术是获取信息的最有效的技术工具。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。
2、在信息经济时代,对企业来说,谁对市场变化反应速度快,谁将在激烈的市场竞争中占据有利的地位,竞争的结果最终将促使企业价值从市场竞争输家转移到赢家,这样就使企业面临一个问题:如何才能把大量的数据资源,转化成自身价值呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对“人们被数据淹没,人们却饥饿于知识”的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。二、2.1国内研
3、究现状KDD(从数据库中发现知识)一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。迄今为止,由美国人工智能协会主办的KDD已经召开了7次,规模由原来的专题讨论会发展到国际学术大会,人数由二三十人到七八百人,论文收录比例从2X1到6X1,研究重点也逐渐从发现方法转向系统应用,并且注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。其他内容的专题会议也把数据挖掘和知识发现列为议题之一,成为当前计算机科学界的一大热点。此外,数据库、人工智能、信息处理、知识工程等领域的国际学术
4、刊物也纷纷开辟了KDD专题或专刊。IEEE的Knoerce)是以指利用电子数据交换(ElectronicDataInterchange,EDI)、电子邮件(E-mail)、电子资金转账(ElectronicFundsTransfer,EFT)和Inter等主要技术在个人、企业和国家之间进行无纸化的信息交换,包括商品信息及其信息、资金信息及其支付信息、安全及其认证信息等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。其最终目标是实现商务活动的X络化、自动化与智能化。随着Inter的迅
5、速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。2.2数据挖掘技术2.2.1统计技术统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假定了一个分步或者概率的模型(比如一个正态分布),然后根据模型采用相应的方法进行挖掘。2.2.2关联规则数据关联是数据库中存在的一类很重要的可以发
6、现的知识。若两个或者多个变量的取值之间存在某种规律性,就成为关联。关联可分为简单关联,时序关联,因果关联。关联分析的目的是找出数据库中隐含的关联X,优势并不知道数据库中的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。2.2.3基于历史的分析MBR(Memory-basedReasoning)MBR的本质是:现根据经验知识寻找相似情况,然后再将这些情况的信息应用于当前的例子中。使用的三个问题是:寻找确定的历史数据;决定表示历史数据的最有效方法;决定距离函数、联合函数和邻近的数量。
7、2.2.4遗传算法GA(GeicAigorithms)该算法是基于进化理论,并采用遗传结合、遗传变异及自然选择等方法优化结果。主要思想是:根据适者生存的原则,形成由当前群体中最适合的规则组成新的群体,以及这些规则的后代。规则的适合度(Fitness)是对训练样本分类准确性的评估。2.2.5聚集检测将物理或者抽象对象的集合,分组成为由类似的对象组成的多个类的过程被成为聚类。在由聚类生成的数据对象集合中,这些对象具有相似性,并与其他集合中的对象具有相异性。这种相异度是根据描述对象的属性值来计算的,距离
8、是经常被采用的度量方法。2.2.6连接分析它的基本理论是图论,图论的思想是寻找一个可以得出好的结果但不是完美结果的算法。这种不完美但是可行的思想模式,可以使之运用到更广的用户群中。2.2.7决策树决策树是能够被看成一棵树的预测模型。树的每个分支都是一个分类的问题,内部节点表示在一个属性上的测试,树叶代表类或者分布。决策树算法是目前应用最广泛的归纳推理算法之一,是一种逼近离散值函数的方法,也可将它看作是一个布尔函数。它是以实例为基础的归纳学习算法,通过对一组训练数据的学习,构造出决策
此文档下载收益归作者所有