基于复杂网络的数据挖掘分类问题研究与应用

基于复杂网络的数据挖掘分类问题研究与应用

ID:32966269

大小:3.49 MB

页数:62页

时间:2019-02-18

基于复杂网络的数据挖掘分类问题研究与应用_第1页
基于复杂网络的数据挖掘分类问题研究与应用_第2页
基于复杂网络的数据挖掘分类问题研究与应用_第3页
基于复杂网络的数据挖掘分类问题研究与应用_第4页
基于复杂网络的数据挖掘分类问题研究与应用_第5页
资源描述:

《基于复杂网络的数据挖掘分类问题研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、辽宁师范大学硕士学位论文基于复杂网络的数据挖掘分类问题研究与应用姓名:赵凤霞申请学位级别:硕士专业:计算机软件与理论指导教师:谢福鼎20090501摘要:随着信息技术的快速发展,特别是计算机技术的不断普及,“数据丰富而信息贫乏"这一矛盾显得日益突出,数据挖掘技术正是迎合了这一需求,同时结合数理统计、人工智能、神经网络和信息技术等学科出现的一项新技术,并得到了迅速发展。数据挖掘的主要目的是从数据集中发现隐含的、事先未知的和用户感兴趣的知识。作为一种有效的数据分析技术,近年来分类(Classification)已成为数据挖掘领域

2、中的一项重要研究内容,并广泛应用于商业、电子商务、基因工程和医学等诸多领域。复杂网络作为一门新兴学科,在不同的领域(如生态、人口、经济、社会、地理、军事、医学)中有着很强的应用背景,倍受广大学者的青睐和关注,已成为一个充满生命力的交叉研究领域。一切事物都是相互作用的表现,大多可以通过复杂网络来表现,如物理学研究物体间最基本的相互作用;化学研究分子间的相互作用;生物学研究基因、蛋白质以及生物体之间的相互作用;社会科学研究人和各种人类组之间的相互作用;分类问题研究数据点之间的相互作用。因此,事物作为系统,其结构可以抽象为网络,各

3、类作用体抽象为网络节点,各种相互作用抽象为节点之间的连接线或边。基于这种思想,本文将数据集按照某种度量抽象成为复杂网络,结合复杂网络的理论、成果和已有的某些分类、聚类方法对数据挖掘分类问题进行了相关研究,提高了对大型数据库中的数据进行分类的能力,具有一定的研究价值。复杂网络的社团探测与数据挖掘中分类、聚类问题在本质上是一样的,因而社团探测的研究和分类问题的研究在某种角度上是一脉相承的。本文在复杂网络的基础上,对分类问题做了以下三个方面的工作:提出了一种基于K-means聚类算法的复杂网络社团结构划分方法,丰富和发展了复杂网络

4、社团探测理论和方法。算法基于Fortvnato-等人提出的边的信息中心度,定义了节点的关联度,并通过节点关联度矩阵来进行聚类中心的选择和节点聚类,从而将复杂网络划分成K个社团,然后通过模块度来确定网络理想的社团结构。该算法时间复杂度为线性的,适合大型网络的社团发现。通过ZacharyKag'8te甜曲和Co]]egeFootballNetwor炳个经典模型验证了该算法的可行性。遗传算法作为一个成熟的理论,在分类方面有着很大优势,结合复杂网络的部分新理论和遗传算法的思想,提出了一种新的分类方法。该方法将数据集按给定的相似度公式

5、构造出具有社团结构的网络,在此网络的基础上用遗传算法的思想进行分类。算法引进社团模块度作为适应度函数,并且提出了节点归类错误率(NCM)对每次迭代产生的解进行纠错,提高了分类质量和速度。实验证明该方法在分类精度和分类速度方面都非常理想,并可实现并行性,将遗传算法的优点发挥到极致。医学图像分类对实现智能化诊断系统有着重要的实际意义,是典型的分类挖掘问题之一,同时也是一个热点的应用研究课题。为了建立高效的肿瘤自动诊断系统,克服因医学MIR图像的复杂性带来的直接从图像中看出肿瘤及良、恶性质的困难,结合复杂网络的部分理论成果和K—m

6、eans聚类算法的思想,提出了基于加权复杂网络聚类的医学图像分类器。该分类器对医学图像进行预处理,建立图片特征库,构建图片加权复杂网络,在此基础上根据网络节点的加权网络特征值和连接度选取初始聚类中心进行聚类,有效地克服了传统K-means聚类算法对初始化选值敏感性的问题,从而大大提高了分类精度。通过对某医院PACS系统中的部分MIR脑部图片进行分类,表明了该方法的分类精度比传统的K-means聚类算法平均提高了8%左右。关键字:数据挖掘;分类;复杂网络;社团探测;遗传算法;医学图像分类器ABSTRACT:Withtherap

7、iddevelopmentoftheinformationtechnology,especiallyintherealmofcomputerscience,thecontradictionsbetweenrichdataandpoorinformationarebecomingincreasinglyacute.Therefore,theurgentrequirementofresolvingthecontradictionconfrontsUS.Anewtechnologynameddataminingemergesand

8、shortlybecomesflourishedinthisbackground.Itcombineswithmathematicalstatistics,artificialintelligence,neuralnetworkandinformationtechnology.Themai

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。