高维复杂数据的子空间挖掘方法研究.doc.doc

高维复杂数据的子空间挖掘方法研究.doc.doc

ID:27360381

大小:62.00 KB

页数:6页

时间:2018-12-02

高维复杂数据的子空间挖掘方法研究.doc.doc_第1页
高维复杂数据的子空间挖掘方法研究.doc.doc_第2页
高维复杂数据的子空间挖掘方法研究.doc.doc_第3页
高维复杂数据的子空间挖掘方法研究.doc.doc_第4页
高维复杂数据的子空间挖掘方法研究.doc.doc_第5页
资源描述:

《高维复杂数据的子空间挖掘方法研究.doc.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2017年度广东省科学技术奖项目公示项目名称高维复杂数据的子空间挖掘方法研究主要完成单位单位1:哈尔滨工业大学深圳研究生院单位2:无单位3:无主要完成人(职称、完成单位、工作单位)1.叶允明职称:教授工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:提出本项目的关键学术思想和研究思路,全面规划组织并研究了本项目的研究内容,对项目四个主要创新点均做出了贡献:(1)提出了属性加权的子空间聚类方法,有效解决了高维数据的聚类问题。(2)提出了基于分层子空间抽样的随机森林方法,减小了泛化误差界

2、,提升了高维数据的分类性能。(3)揭示了聚类问题中多模态子空间的规律,为关系型高维数据的子空间分类奠定了基础。(4)建立了多模态子空间数据分类的关键技术,为解决复杂关系型数据的分类奠定了基础。应用贡献:将项目成果应用于深圳出入境检验检疫局“智慧口岸”建设中的信息自动获取与智能信息服务、深圳市地税局、中油瑞飞信息技术有限公司等单位的互联网信息获取与挖掘服务等。2.李旭涛职称:副教授工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(1)(2)和(3)做出了贡献:(1

3、)提出了层次子空间聚类算法,有效解决了高维数据的多粒度子空间聚类问题。(2)揭示了分层抽样子空间的规律,分析了其基本特性,明确了分层抽样随机森林算法的适用范围。(3)提出了基于张量积的马尔科夫链,并基于其建立了多模态聚类模型,有效解决了复杂关系型数据的聚类问题;提出了基于全变分约束张量分解的聚类算法,解决高维多模态数据的子空间聚类问题。3.张海军职称:副教授工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(1)和(4)做出了贡献:(1)揭示了判别信息在高维数据子

4、空间聚类中的作用,提出了结合簇内紧致性和簇间分离性的聚类优化目标函数。(4)提出了面向多模态文本数据的子空间分析算法,通过多维度浅层语义分析提升了子空间分类的性能;揭示了高维多类标数据的层次特性,为了其分类模型的建立奠定了基础。4.吴庆耀职称:无工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(2)和(4)做出了贡献:(2)建立并实现了基于分层抽样的随机森林算法,验证了其在文本、图像、基因等数据分类的有效性和优越性;提出了基于聚类树的多类标分类模型。(4)提出了

5、基于马尔科夫链的复杂关系型数据的分类模型,有效的提升了分类性能。5.陈小军职称:无工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(1)做出了主要贡献:提了两个属性加权的聚类算法,即两层加权的子空间聚类算法和分组加权的子空间聚类算法,提升了高维数据的聚类性能。6.张晓峰职称:副教授工作单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(1)做出了主要贡献:提出了基于分布式数据的子空间聚类算法。7.黄晓辉职称:无工作

6、单位:哈尔滨工业大学深圳研究生院完成单位:哈尔滨工业大学深圳研究生院主要贡献:对本项目的主要创新点(1)做出了主要贡献:建立了基于簇内紧致性和簇间分离性的聚类算法。项目简介聚类和分类是目前各行各业大数据挖掘所面临的两个基本任务。然而目前大数据时代中数据独有的超高维特性和复杂性给它们带来了重要挑战。首先,超高维度为聚类和分类带来了维度灾难挑战——即当在数学空间上额外增加一个维度,其体积会呈指数级增长;随着维度提高,空间的体积迅速提高,可用数据变得非常稀疏。其次,数据样本间关联关系的复杂性也给聚类和分类带来了另一大挑战

7、。此外,除了样本间关系的复杂性,很多领域数据的维度具有多模态特性。尽管目前已有一些子空间聚类和分类算法被提出,但这些算法的不足以克服高维复杂数据所带来的这三个挑战。针对上述问题,本项目提出了系统的研究了高维复杂数据的子空间挖掘方法,取得了四方面的创新性突破:(1)针对高维数据的聚类问题,提出了一系列子空间加权的聚类方法,包括双层子空间加权、分组子空间加权、层次子空间聚类、基于簇内紧致性和簇间分离性子空间方法等,有效的解决了不同情况的高维数据的聚类问题,获得了国际领先的聚类精度,且具有很高的运行效率,适合大规模数据聚

8、类。(2)针对高维数据的分类问题,提出了各种子空间学习方法,包括基于分层抽样的随机森林算法和基于层次树的多粒度子空间分类方法,可有效的解决各种领域如文本、基因、图像等分类问题,尤其在基于SNP序列的帕金森病例分类上,不但获得了较高的分类精度,还判别出一些与帕金森疾病密切项目的基因,对于该疾病的病理分析、治愈和制药具有很好的借鉴意义。(1)针对高维多模态关系型

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。