数学建模之模糊数学(老师推荐)

数学建模之模糊数学(老师推荐)

ID:14281972

大小:225.50 KB

页数:6页

时间:2018-07-27

数学建模之模糊数学(老师推荐)_第1页
数学建模之模糊数学(老师推荐)_第2页
数学建模之模糊数学(老师推荐)_第3页
数学建模之模糊数学(老师推荐)_第4页
数学建模之模糊数学(老师推荐)_第5页
资源描述:

《数学建模之模糊数学(老师推荐)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、三种典型聚类算法在职员评定中的应用摘要:通过利用三种典型算法:Q-型模糊聚类算法、K-Means算法及K-medians算法,对公司职员的年终评定进行应用分析,得到了不同的聚类结果,通过对结果的分析比较、探讨,得出针对不同问题,应结合实际,有针对性地用不同算法更适合。并在此基础上,对聚类算法的聚类过程、本文后续工作进行了探讨总结。关键词:数据挖掘,聚类分析,Q-型模糊聚类,K-means算法,K-medians算法中图分类号:O235文献标识码:A1前言随着信息化进程的发展,如何借助计算机的强大处理功能,从海量的繁杂数据中发现对我们有意义的信息

2、并指导我们对研究工作做出更为准确、有效的预测和决策,这正是数据挖掘技术需要解决的问题。其中,聚类分析就是依据数据对象之间的关系及特点,使得同一组内的对象具有较大的相似性,不同组中的对象具有较高的相异性『1』,解决大量数据间的某种分类关系问题的一种重要方法。2三种典型聚类算法聚类算法有多种,本文选取三种主要的分类算法,从中探讨它们的异同,得出相关主要结论。2.1Q-型模糊聚类算法聚类分析根据分类对象的不同分为R型和Q型两大类,R型是对变量指标进行分类处理,Q型是对样品进行分类处理,以下简单对Q型聚类进行阐述。2.1.1建立模糊关系中的元素与的接近

3、程度,称为相似系数(其中)。相似系数构成的模糊矩阵是上的模糊关系。其中确定相似系数的方法很多。在实际的聚类问题中,先通过数据标准化后,通过建立上的模糊关系或模糊相似关系,以模糊相似矩阵为基础来讨论分类问题,然后用最大树法进行分类,根据阀值即可得出聚类结果。2.1.2结果评价准则为了评价聚类结果的好坏,需要定义准则函数,聚类问题转化为使准则函数取极值的优化问题。一般的聚类分析要解决两个问题,一个是如何确定类的个数,即把n个样本聚成多少类才合适,另一个是在给定类的个数c的情况下,如何把n个样本聚成c个类。针对第一种问题,在模糊聚类分析中,对于不同的

4、6,可以得到不同的分类,从而形成动态模糊聚类图。但许多实际问题中如何根据的值来确定样本的具体分类。常用的两种方法有[2]:(1)按照实际需要,由专家结合专业知识来确定值,得出在水平上的等价分类。(2)用F-统计量确定最佳值。设论域为样本空间(样本总数为n),而每个样本由m个特征(即由试验或观察得到的m个数据):。得到原始数据矩阵,其中称为总体样本的中心向量。设对应于值的分类数为r,第j类的样本数为,第j类的样本记为:第j类的聚类中心为向量,其中为第k个特征的平均值:作F-统计量F=,(1)其中为类内样本间的距离。(1)式遵从自由度为(r-1,n

5、-r)的F-分布。因此,F值越大,说明类与类之间的距离越大,表明类与类之间的差异越大,分类就越好。如果F>,则根据数理统计分析理论知道类与类之间差异是显著的,说明分类比较合理,如果满足不等式F>的F值不止一个,则可以进一步考查差(F-Fa)的大小,从较大者中找一个满意的F值就行了,即就圆满的解决了存在的第一个问题。2.2k-means聚类算法K-means即K均值聚类算法。该算法根据聚类中心的均值进行分类划分,其处理过程如下:首先,随机选择k个对象,初始代表一个类的中心值。其次,对剩余的每个对象,根据其与类中心的距离,将它赋予最近的类,然后重新

6、计算每个类的平均值。这个过程不断重复,直到准则函数收敛。通常,采用平方误差准则,其定义如下:6=其中,E表示所有聚类对象的平方误差的和,p是聚类对象,mi是类Ci的各聚类对象的平均值,表示类Ci的聚类对象的数目。由于该方法对初值敏感,不同的初值、种子点、聚类个数K、初始划分等都可能会导致不同的聚类结果,此外,均值体现的是数据集的整体特征,而掩盖了数据本身的特性,由于目标函数局部极小值点的存在,该算法可能会陷入局部最优,无法达到全局最优,因此应用范围有一定的局限性。2.3K-medians聚类算法K-medians方法的基本策略是通过避免孤立点,

7、而选择类中最中心的对象作为参照点,然后计算其它点与这些参照点的距离,再按照距离重新聚类,分配给最近的一个簇,直到数据点不再改变所属的类为止,以此改进聚类的质量。聚类结果的质量用一个代价函数来估算,该函数可以度量对象与其参照对象之间的平均相似度。与K均值方法比较,这种划分方法,不采用簇中对象的平均值来作为参照点,而是找出簇中位置最中心的对象,即中心点来代表簇,然后通过分组排序。该方法也是基于最小化(最大化)所有对象与其参照点之间的相似度之和的原则来执行的,适用于类数固定,偏好球形的聚类[3]。3三种聚类分析方法在公司职员评定中的分析比较应该三种方

8、法对对公司年终员工进行考核(限于篇幅仅以9名员工,4个指标为例),把客户评价指标量化,根据考核要求用4级评分制,优对应5分,良对应4分,一般对应3分,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。