欢迎来到天天文库
浏览记录
ID:15339370
大小:50.00 KB
页数:11页
时间:2018-08-02
《稳定性理论在数据挖掘中的应用_bi_管理信息化_2074》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、稳定性理论在数据挖掘中的应用_BI_管理信息化 当数据库挖掘到一定程度,就会发展到利用数学、物理等学科的理论技术来进行研究,其中稳定性数据挖掘就是其中一种。 二十一世纪是一个信息化智能管理的时代,各种各样的技术都在和智能技术“联姻”。数据挖掘便自然而然地成为人们倍受关注的焦点。如果你是一位工作多年的公司决策者或者在你的主持下策划了几家大企业的市场规划;如果你正徘徊在创业者的大军中,并且想从中脱颖而出;如果你正苦于企业经营状况不佳,并且想力挽狂澜走出低谷……你就不能回避这样一个问题:如何构建一个庞大而稳定的客户群?本文就为你提供了一个崭新而科学的思路。1概述稳定性理论 运动系统
2、的稳定性是自然科学和工程技术中很受人们关注的问题。古典的例子是太阳系的稳定性及旋转星体的稳定性。 众所周知,微小的干扰因素对于不同物质系统运动的影响是不一样的。对于一些运动,这种影响并不显著,因而受干扰的运动与不受干扰的运动相差很小。反之,对于另外一些运动,干扰的影响就可能很显著,以致于无论干扰的力多么小,受干扰的运动与不受干扰的运动随着时间的推移可能相差很大。简单地说,属于前者的运动就称为稳定的,而属于后一类型的运动,则称为是不稳定的。 “稳定性”这个词起源于力学,它描述了一个刚体运动的平衡状态。通常我们说某个刚体的平衡状态是稳定的,就是说这个刚体在受到干扰力的作用,并把它从原
3、来的位置微微移动后,它仍然能回到它原来的位置;反之,如果该物体不能回到原来的位置,而趋于一个新的位置,我们就说这个状态是不稳定的。最常见的一个例子就是单摆。 例如:质量为m的球,用长为1的细线悬挂在O点,在地球引力作用下作往复摆动,若不计悬线的质量,则称此系统为单摆。 我们可以求出摆球的运动方程式:以时间t为自变量,细线与垂线的摆角为未知函数θ(t),u为阻力系数,重力加速度为g。设逆时针方向为θ的正向,即有: (1) 因为系统(1)的零解渐稳,即:对(1)的解x=θ(t)都有,其图形为:图1 由于阻尼的存在,在振动过程中,机械能转化为热能。所以振动逐渐减弱
4、,直至停止,即:2。那么,如何维持系统的振动,而不使其停止呢?这就需要施加一个强迫力。 (Ⅰ)这时单摆的运动方程是: (2) 令,Hsin(pt)为一个周期性外力,当ζ<ω时,求得(2)的解为: y=Bcos(pt)+Csin(pt) (*) 其中 将(*)式化为正弦函数: 在实际振动中,我们关注当外力的频率p取何值时,引起强迫振动下的振幅H*达到最大值?为此我们讨论(W2-p2)2+4ζ2p2在p取何值时达到最小值。 显然,时取最小值,相应最大振幅为 (Ⅱ)当ζ<ω时,为大阻尼振动;当ζ=ω时,为临界阻尼振动。这两种振动都是非周期
5、振动衰减,无法施加一个周期性的外力使单摆振动具有周期性。所以此时要达到最大振幅,可以在单摆能承受的范围之内,给予尽可能大的外力。 上面我们讨论了单摆的稳定性,我们研究了单摆的大阻尼振动,临界阻尼振动,小阻尼振动三种情况。同时,也考察了单摆在不同情况下振幅的最大值以及何时能达到最大值,还讨论了单摆的振动衰减。我们研究单摆的稳定性的意义在于将其应用于实践或从研究中得到某种启示。近年来,有关稳定性理论与数据挖掘相关联的研究方兴未艾,国外有关论文与论著比比皆是,那么二者之间有何联系呢? 对于这种联系的说法不一,归纳起来有以下几点: (1)单摆的振幅最大与顾客在超市中一次购物所花金额最
6、大相联系; (2)单摆的振动衰减与顾客购物心理衰减相联系; (3)单摆的运动起点与购物起点,即顾客第一次到商店的消费量相联系。 下面我们就用分类法数据挖掘来探讨一下这个问题。2分类法数据挖掘 分类法数据挖掘是一个既传统又新颖的研究领域。它是找出一组能够描述数据集和典型特征的模型(或函数),以便能够识别未知数据的归属(attribute)或类别(class)。也就是说,将未知事例映像到某种离散类别之一。分类模型可以通过某种分类挖掘算法从一组训练样本中学习获得。 如下图所示,人们从客观世界中分类收集包含各种信息的数据,然后从中分析出所需要的信息;对信息进行分析提炼得到领域
7、知识,再以此去指导人类改造客观世界的实践活动。图2 利用数据库挖掘技术可以帮助获得决策所需的多种知识。一般情况下用户并不知道信息中已存在的有价值的决策知识,这就需要挖掘提炼出多种模式的知识,以满足用户的期望和需要。 分类法数据挖掘的重要意义在于,为商业、科研等活动的决策提供所需要的知识。它有两种分析处理形式,使用这两种形式可以抽取重要数据集合并预测未来数据走势。这两种数据分析处理形式是有监督学习和无监督学习。前者是在已知训练
此文档下载收益归作者所有