关联规则算法的研究及在海岸线分类中的应用

关联规则算法的研究及在海岸线分类中的应用

ID:37409502

大小:1.68 MB

页数:50页

时间:2019-05-23

关联规则算法的研究及在海岸线分类中的应用_第1页
关联规则算法的研究及在海岸线分类中的应用_第2页
关联规则算法的研究及在海岸线分类中的应用_第3页
关联规则算法的研究及在海岸线分类中的应用_第4页
关联规则算法的研究及在海岸线分类中的应用_第5页
资源描述:

《关联规则算法的研究及在海岸线分类中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着遥感技术的发展,海洋数据爆炸式增长,利用计算机技术,尤其是数据挖掘技术分析数据已成为从海量数据中发掘有用信息的手段。作为海洋保护的重要课题之一,海岸线分类吸引了越来越多的研究者。如何从大规模海洋数据中找出海岸线的分类规则,成为亟待解决的问题。为了提高关联规则算法处理海量数据时的效率,研究者提出了基于数组的关联规则算法和基于分区的关联规则算法。基于数组的关联规则算法将数据库中的数据存放到内存中的二维数组中,将后续对数据库的扫描转化为对内存中二维数组的扫描,此算法只需扫描一次数据库,提高了算法的效率,但是面对海量数据的关联规则挖掘,由于内存的限制,无法将数据库上的整

2、个数据集放入内存中的二维数组中,使得挖掘无法进行,分区算法很好的解决了此问题,此算法扫描数据库三次,最终得到整个数据中的所有关联规则。但是面对海量的数据挖掘,三次扫描数据库严重影响了算法的效率。为了协调内存限制和扫描次数两因素,本文改进了Apriori算法,并将其应用于海岸类型识别,主要工作包括:(1)提出了一种基于一次扫描的分区Apriori算法。随机抽取样本放入到各个分区,并采用基于数组的Apriori算法获取每个分区上的关联规则和关联规则的分区支持度,然后根据最小分区支持度得到整个数据集上的近似关联规则。实验结果验证了本文算法在处理海量数据方面的有效性。(2)将基

3、于一次扫描的分区Apriori算法应用于海岸类型识别。根据基于数组分区的关联规则算法,在基岩海岸、砂(砾)质海岸、淤泥质海岸和生物海岸等四种基本海岸类型的地物样本中挖掘出区分规则,并利用这些规则分离四种海岸类型。关键字:数据挖掘,关联规则,Apriori算法,分区,海岸线分类●AbstractWiththedevelopmentofremotesensingtechnologyandexplosivegrowthoftheoceandata,usingcomputertechnology,especiallythedataminingtechnologyhasbecom

4、etheprimarymeanstodiscoverusefulinformationfrommassivedata.Asoneoftheimportanttopicofmarineprotection,coastlineclassificationhasattractedagrowingnumberofresearchers.Howtofindoutthecoastlineclassificationrulesfromthelarge—scaleoceandataisacriticalproblemneedtobesolved.Inordertoimprovethea

5、ssociationrulesalgorithmtohandlemassivedataefficiently,researchersproposedarray—basedassociationalgorithmandthepartition-basedassociationalgorithm.Array-basedassociationalgorithmstoresthedataindatabasetoatwo-dimensionalarrayinmemory,willscansthetwo-dimensionalarrayinsteadofthedatabasesca

6、nning.Asitneedstoscanthedatabaseonlyonce,SOefficiencyisimproved.Howeverwhenfacingofmassivedataassociationmining,duetomemorylimitations,itcannotsetentiredataofthedatabaseintothetwo-dimensionalarray,makingtheminingprocesscannotbecarriedouLthepartitionalgorithmisagoodsolutiontothisproblem.T

7、hisalgorithmscansthedatabasethreetimes,andwillgetalloftheassociationrulesoftheentiredatafinally.Butwhenfacinghugeamountsofdata,scansthedatabasethreetimesisaseriousproblemthatwillimpacttheefficiencyofthealgorithm.Firstly,proposedpartitionApriorialgorithmbasedononetimescann

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。