聚类-EM算法.ppt

聚类-EM算法.ppt

ID:48756322

大小:555.00 KB

页数:13页

时间:2020-01-21

聚类-EM算法.ppt_第1页
聚类-EM算法.ppt_第2页
聚类-EM算法.ppt_第3页
聚类-EM算法.ppt_第4页
聚类-EM算法.ppt_第5页
资源描述:

《聚类-EM算法.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、例1:为了调查学校学生身高,随机抽样n个男生和m个女生,设身高服从正态分布,试确定男女生对应的均值与方差。极大似然估计例2:设某组零件的不合格率p,抽样n个零件,其中t个不合格零件,试估计不合格率p。例3:若例1中男女生数据混合无法区分,即只知总人数,试确定男女生对应的均值与方差。分析:该问题含两个正态分布,每个样本有2种参数需要估计:第一、每个样本属于1还是2(隐藏的标签)?第二、每一类样本的均值与方差?1、若隐藏的标签已知,则由极大似然估计易得均值与方差;2、若均值与方差已知,则可以进一步调整样本标签;1’、样本标签已被隐藏,可假设隐藏标签已知,写出(对

2、数)似然函数表达式对隐藏的标签取期望后,再采用极大似然估计的均值与方差;EM(expectaion-maximization)期望--最大化方法混合Gauss模型给定N个观测样本,满足如下混合形式的概率:求混合分布的三组参数EM算法流程:1、任意给出高斯分布的参数,需要保证2、Expectation步:3、Maximum步:用最大似然估计重新估计均值、方差和权重。4、返回第2步,直到各参数的值变化小于指定精度e一般的EM算法EM算法改进关于初始点的选择初始值的获取可以通过k-means算法,层次聚类算法或者是对数据进行随机的分割.[1]重复利用EM,CEM和

3、SEM进行初始点的选择.[2][1]McLachlan,G.J.andNg,S.K.(2008).TheEMalgorithm.[2]ChristopheBiernachi,GillesCeleux,GerardGovaert.(2003).ChoosingstartingvaluesfortheEMalgorithmforgettingthehighestlikelihoodinmultivariateGaussianmixturemodels.11EM属于聚类算法,其主要缺点收敛速度慢;算法高度依赖初始值的选择.12例:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。