基于PCA与MLE方法的人群分类新方法研究-论文.pdf

基于PCA与MLE方法的人群分类新方法研究-论文.pdf

ID:53028660

大小:225.31 KB

页数:4页

时间:2020-04-14

基于PCA与MLE方法的人群分类新方法研究-论文.pdf_第1页
基于PCA与MLE方法的人群分类新方法研究-论文.pdf_第2页
基于PCA与MLE方法的人群分类新方法研究-论文.pdf_第3页
基于PCA与MLE方法的人群分类新方法研究-论文.pdf_第4页
资源描述:

《基于PCA与MLE方法的人群分类新方法研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29卷第2期沈阳化工大学学报Vo1.29No.22015.06J()1IRNALOFSHENYANGUNIVERSlTYOFCHEMICAL1'ECHNoL0GYJun.2015文章编号:2095—2198(2015)02—0168—04基于PGA与MLE方法的人群分类新方法研究张成,刘亚东,谢彦红,李金娜,张可意,李元(1.沈阳化工大学数理系,辽宁沈阳110142;2.大连理工大学公共管理与法学院,辽宁大连116024)摘要:针对人群分类管理问题,提出一种基于主元分析方法的新的单变量贡献度方法.首先,研究各行为属性对主元的贡献率,

2、确定人群关键行为属性.然后,在确定关键属性的基础上,利用最大似然估计方法对人群进行分类管理.应用人群分类管理方法到警方侦破案件中,可大大减小案件的搜索范围,达到提高警方办案效率的目的.通过实例验证了方法的有效性.关键词:主元分析(PCA);属性分类;最大似然估计(MLE)doi:10.3969/j.issn.2095—2198.2015.02.016中图分类号:C939文献标识码:A近年来,我们国家物质生活与精神文明的水行为属性,因此,首先应确定警方所需要的关键平得到了较大的提高,社会更加稳定与和谐.但属性.对某一地区人口进行大规模属

3、性调查,根由于我国人口基数较大,每天仍然有较多的违法据各项属性表现强弱,进行量化处理.针对该问犯罪行为发生.又因为警力有限,有时不得不根题的建模可以转化为多变量统计分析问题,利用据案子的轻重来决定其侦破的优先等级,因此,主元分析PCA3-53,研究各行为属性对主元的对于一些小型犯罪行为很难再付出较大警力进贡献率,确定人群关键行为属性.行专门排查,一小撮犯罪分子或成漏网之鱼.在获得居民关键属性的基础上,利用最大似目前,许多国家和城市都在研究犯罪行为分然估计MLE分类方法对人群进行分类管理,减析系统.国内现有的犯罪行为分析方法大多是采小案

4、件的搜索范围,达到提高警方办案效率的目用心理学的方法.这种方法在数据量不大的情况的.下是很有效的,但在海量数据下,就存在分析不1关键属性的确定够全面的缺点.科学的案件分析和预测机制,可以对犯罪模式进行有效的识别,从而快速配置警大量数据分析中,将抽象的各种行为指标量力,发现和揭露犯罪行为.在实际工作中,必须在化,然后对其进行PCA统计分析.量化后的数据制度保证下完善刑警工作OA(OficeAutoma.矩阵为,其中m为受访人数,n为普查统计tion)机制,提高刑事案件信息的收集效率,增加的行为属性个数,如下所示:刑事案件分析的数据来源,

5、提高分析质量⋯.针alIa12对这一工作,黄建设_2等利用数据挖掘技术对a21a22X=犯罪行为进行分析.为了能够以最小的代价来侦破更多的案件,am1口柁需要对大规模的人群进行分析.在对大规模人口基于协方差的PCA方法将的每一列数据进行多种行为属性调查时,存在参考价值较低的进行减去相应变量均值除以相应变量标准差的收稿日期:2014—03—24基金项目:国家自然科学基金资助项目(60774070,61174119);国家自然科学基金重点课题资助项目(61034006)作者简介:张成(1979一),男,辽宁锦州人,讲师,博士,主要从事故障

6、诊断的研究.第2期张成,等:基于PCA与MLE方法的人群分类新方法研究标准化操作以后,认为所有变量自身数据分布为将SVC较大的几个行为属性作为关键行为标准正态分布.定义标准化后的样本的协方属性.同时假设不同犯罪分子在某些行为属性上差矩阵为:的确异于常人,反映到量化指标上,是严重偏离1一正常分布中心范围的;且假设参与信息统计的所S=cov(X)÷x(2)n一上有正常人群类个体严格不具备犯罪倾向.在以往对该矩阵进行特征值分解,并且按照特征值大量历史统计的数据中,选择几种不同的群类,的大小降序排列.PCA模型对进行如下分解:分别求取该类的S

7、VC.不同犯罪群类的SVC与=+E=TP+E(3)正常人群类的SVC对比,求异去同,得出该犯罪T=XP(4)群类的关键行为指标.其中,为原矩阵分解后,携带有原矩阵大部分信息的主元信息,E为分解后携带有少量信2人群分类管理息的残差信息,P∈R是负载矩阵,由的前A针对上述讨论得到人群关键属性信息个特征向量构成.T∈R~为得分矩阵,的各X,利用MLE方法将人群进行分类,将居民分列被称为主元变量,A表示主元的个数,也是得为K组.分矩阵的列数.得分矩阵的各列是相互正交的,P(,lC)表示第-『名居民属于第C组的条说明这些主元是统计线性无关的.主

8、元的协方差件概率,P表示第i组居民所占的人口比例,每矩阵可以由下式得到一组居民人数为Ni(i=1,⋯,k).『A·00]=—=J【-0‘.0l(5)P=(8)L00Aj其中A1≥A2≥⋯≥A表示的前A个较大的特P(xjl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。