基于非参数检验的划分--凝聚层次聚类变点识别法.pdf

基于非参数检验的划分--凝聚层次聚类变点识别法.pdf

ID:54018107

大小:912.22 KB

页数:5页

时间:2020-04-28

基于非参数检验的划分--凝聚层次聚类变点识别法.pdf_第1页
基于非参数检验的划分--凝聚层次聚类变点识别法.pdf_第2页
基于非参数检验的划分--凝聚层次聚类变点识别法.pdf_第3页
基于非参数检验的划分--凝聚层次聚类变点识别法.pdf_第4页
基于非参数检验的划分--凝聚层次聚类变点识别法.pdf_第5页
资源描述:

《基于非参数检验的划分--凝聚层次聚类变点识别法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、·质量管理·标准科学2013年第12期基于非参数检验的划分——凝聚层次聚类变点识别法胡文静聂斌(天津大学,天津300072)摘 要:变点识别是统计过程控制第一阶段的主要任务,通过对大量历史数据进行分析,识别出运行状态发生变化的准确时间点,则有利于分析运行状态变化的原因,从而改善生产等各种过程的表现。针对时间顺序数据,本文提出将划分层次聚类法与凝聚层次聚类法相结合的变点识别方法,并在凝聚层次聚类中采用非参数检验法。通过仿真对方法性能进行分析和比较,结果显示本方法具有良好的变点识别性能。关键词:变点识别划分层次聚类凝聚层级聚类Mann-WhitneyU检验Divisive-A

2、gglomerativeHierarchicalClusteringChange-PointIdentificationMethodBasedonNon-parametricTestHUWen-jingNIEBin(TianjinUniversity,Tianjin300072)Abstract:Change-pointdetectionisthemaintaskofstatisticalprocesscontrolPhaseone.Thepaperanalyzesanamountofhistoricaldata,identifiestheaccuratetimewhen

3、processeschangecanhelpustoanalyzethecausesforvariationandimprovestheprocessperformancesuchasindustrialproductionprocess.Forunvariedtimeordereddata,thispaperpresentsacombinedmethodofhierarchicalclusteringalgorithmandthemethodbasedonnon-parametrictest.Bycomparisonwiththeexistingmethodsonper

4、formance,itisprovedthatthemethodismoreaccurateindetectingchangepoints.Keywords:change-pointdetection,divisivehierarchicalclustering,agglomerativehierarchicalclustering,Mann-WhitneyUtest[3]1引言值的漂移进行检测,达到检测均值偏差的目的。当前变点识别多采用以下方法,一种是基于似然率的变点问题是统计学中一门比较新的课题。对于方法,通常是以似然统计量为监测对象,运用假设变点问题的研究,很多学者

5、认为其开始是在于Page检验的方法识别与变点相对应的最大似然率出现的[1]。(1954)发表的一篇关于连续抽样检验的文章自此以位置。针对正态分布数据中的均值偏移,Hinkley提[4]后,有更多的学者开始对变点问题进行研究。Csorgo出了似然率估计的方法识别数据序列中的单变点,和Horváth的专著对上述研究成果有了一个全面而详Fu和Curnow1990年针对独立分类随机变量序列提出[2][5]细的概括。处理变点问题的方法有很多,休哈特控用最大似然率估计序列中的多变点。制图在监控过程变化上应用非常广泛,LingYang等人另外一类方法是基于聚类分析的,将数据进行提出的监

6、控方法,利用权重均值平方控制图来对均自然分类,使一个类的数据差异最小而类与类之间作者简介:胡文静(1990-)女,硕士研究生,研究方向为质量管理。聂斌(1971-)男,硕士生导师,副教授,研究方向为质量管理与质量工程。702013,No.12STANDARDSCIENCE·QualityManagement·的差异最大。Sullivan研究的方法可以将过程中的数满足,则对下一组两相邻的类进行凝聚,直至最后[6]据分成几种不同类型的数据类。Ghazanfari提出的方一个类。[7]法可以检测到休哈特控制图中的变点。划分-凝聚层次聚类算法减小了计算量,同时可层次聚类包括凝聚和

7、划分,凝聚层次聚类将单以有效去除在划分阶段识别出的异常点。个的数据向量看成是一类,不断对这些小类进行合2.2变点识别并重组,直到所有的数据都组合成一类或者满足某假设每次观测得到一个观测数据,经过一段时一终止条件终止聚类,是自底而上的聚类方法,如间的观测可得到一个含有n个观测值的数据序列,记[8][9][10]King,Karypis,Ying.Z和Karypis.G。划分层次聚为X={x1,x2,…,xn},在这个数据样本中可能存在多个变类则与此相反,是从上向下的聚类方法,如Jain和点。本文的目标就是准确识别出这些变点,为此

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。