欢迎来到天天文库
浏览记录
ID:55398878
大小:466.46 KB
页数:3页
时间:2020-05-15
《基于半结构化分割的Web热点数据挖掘算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第31卷第4期科技通报Vol_3lNo.42015年4月BULLETINOFSCIENCEANDTECHNOLOGYApr.2015基于半结构化分割的Web热点数据挖掘算法阮梦黎(山东管理学院信息工程学院,济南250100)摘要:随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻
2、优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。关键词:数据挖掘;半结构化;热点数据;大数据中图分类号:TP393文献标识码:A文章编号:1001—7119(2015)04一O115—03AlgorithmofWebHotDataMiningBasedonStructuredSegmentationRuanMengli(SchoolofInformationEngineeri
3、ng,ShandongManagementUniversity,Jinan250100,China)Abstract:Withthedevelopmentofbigdatainformationtechnology,onlinemonitoringdataanddatamininghasbecomeahotresearchfieldofcomputerinformation.ThesegmentationofWebhotdatamining,improvetheclassificationabilityofinformationfocusandWebdata.Us
4、ingthetraditionalalgorithmofunstructureddataminingalgorithms,itisnotvalidforWebhotdataforaccuratepositioningandlayeredmining.ThepaperproposedaminingalgorithmWebhotdatastructuredbasedonsegmentation,featuresegmentationusingsemistructureddata,excellentgenesarebasedondifferentialevolution
5、,maketheoptimizationcurvetendstobegentle,parallelonmultiplenodesrunningscript,throughthecodemakestheun—structureddatamappedtothedatablock,makethedatastoredinthedatabaserel~ionaldatamodel,togetthedistributionfactorWebhotdata,improvetheminingperformance.Thesimulationresultsshowthatthehi
6、gheficiencyandaccuracy,itimprovedadaptiveWebhotspotofdataminingoptimizationability.Keywords:datamining;semi—structured;hotdata;bigdata0引言据库系统中,要实现对数据高效访问,需采用动态Web技术,实现良好的访问接口,然后达到高效的数据使用在物联网、云计算和大数据高度发展的今天,信息目的。在动态Web上实现热点的引导工作,可以很好数据呈现指数级增长,人类快步进人大数据时代。对地利用动态Web的强大数据性能,结合多集合融合方Web热点数
7、据挖掘和引导是现代计算机和网络技术大法的优点,为热点引导服务。因此,通过对Web热点数力发展下进行信息交互和传播的重要手段。World据分割挖掘,提高信息热点追踪和Web数据分类能力,WideWeb(www)技术是随着计算机技术和网络技术快研究Web热点数据的挖掘算法受到人们广泛关注。速发展而日新月异的一种新技术,在Web中,信息数据本文首先分析了大数据环境下Web热点数据挖掘交织纷繁,整个Web网络系统中具有海量的数据供人分析的处理流程,提出采用半结构化数据进行特征分们使用和查询。这些大量的数据都存储在Web集成数割,同时借鉴基因表达式算法,充分考虑数据本身特性
8、收稿日期:
此文档下载收益归作者所有