资源描述:
《基于奇异值分解的异常切片挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、遇辉等:基于奇异值分解的异常切片挖掘1287基于奇异值分解的异常切片挖掘*SupportedbytheNationalNaturalScienceFoundationofChinaunderGrantNos.60473051,60473072(国家自然科学基金)作者简介:遇辉(1977-),女,黑龙江哈尔滨人,博士生,主要研究领域为数据挖掘,联机分析处理,模式识别;马秀莉(1972-),女,博士后,主要研究领域为数据挖掘,联机分析处理;谭少华(1960-),男,博士,教授,博士生导师,主要研究领域为人工智能,模式识别;唐世渭(1939-),男,教授,博士生导师,CCF高级会员,
2、主要研究领域为数据库,信息系统;杨冬青(1945-),女,教授,博士生导师,CCF高级会员,主要研究领域为数据库,信息系统.遇辉1,2+,马秀莉1,2,谭少华1,2,唐世渭1,2,杨冬青11(北京大学信息科学技术学院,北京100871)2(北京大学视觉与听觉信息处理国家重点实验室,北京100871)ExceptionalSlicesMiningBasedonSingularValueDecompositionYUHui1,2+,MAXiu-Li1,2,TANShao-Hua1,2,TANGShi-Wei1,2,YANGDong-Qing11(SchoolofElectronic
3、sEngineeringandComputerScience,PekingUniversity,Beijing100871,China)2(NationalLaboratoryonMachinePerception,PekingUniversity,Beijing100871,China)+Correspondingauthor:Phn:+86-10-62755745,Fax:+86-10-62754911,E-mail:yuhui@db.pku.edu.cn,http://www.pku.edu.cnReceived2004-07-16;Accepted2005-03-11Y
4、uH,MaXL,TanSH,TangSW,YangDQ.Exceptionalslicesminingbasedonsingularvaluedecomposition.JournalofSoftware,2005,16(7):1282-1288.DOI:10.1360/jos161282Abstract:Sliceisoneofthemajoroperationsinon-lineanalysisprocessing,whichhasplayedanimportantroleintheapplicationofdecisionsupport.Inthispaper,ameth
5、odofminingexceptionalslicesispresentedforextractingthedistributionfeatureoftheslicedatabasedonthetechniqueofthesingularvaluedecomposition,andtheexceptionalslicescanbefoundbyutilizingthedistance-basedoutlierdetectiontechniqueonthesingularvaluefeature.Theeffectivenessoftheapproachisexperimenta
6、llydemonstratedontheartificialdataandtherealslicesdata.Keywords:exceptionalslicesmining;featureextraction;singularvaluefeaturevector;distance-basedoutlierdetection;on-lineanalyticalprocessing摘要:切片操作是联机分析处理的主要功能之一,在决策支持应用中发挥着重要作用.由于人工的切片过程非常低效,且易忽略重要信息,提出了一种自动、智能的异常切片挖掘方法.该方法基于奇异值分解技术来提取切片的数据
7、分布特征,然后在提取出的奇异值特征之上,利用基于距离的孤立点检测技术发现异常的切片.在人工生成的数据和实际应用的切片数据上所作的实验结果都表明了该方法的高效性和可行性.关键词:异常切片挖掘;特征提取;奇异值特征向量;基于距离的孤立点检测;联机分析处理中图法分类号:TP311 文献标识码:A遇辉等:基于奇异值分解的异常切片挖掘1287联机分析处理(OLAP)是一种数据分析技术,它通过提供多角度、多粒度的查询和展现数据的功能,使得人们得以灵活地观察和分析数据.自从E.F.Codd于1993年