基于半结构化分割的Web热点数据挖掘算法.pdf

基于半结构化分割的Web热点数据挖掘算法.pdf

ID:55398878

大小:466.46 KB

页数:3页

时间:2020-05-15

基于半结构化分割的Web热点数据挖掘算法.pdf_第1页
基于半结构化分割的Web热点数据挖掘算法.pdf_第2页
基于半结构化分割的Web热点数据挖掘算法.pdf_第3页
资源描述:

《基于半结构化分割的Web热点数据挖掘算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第4期科技通报Vol_3lNo.42015年4月BULLETINOFSCIENCEANDTECHNOLOGYApr.2015基于半结构化分割的Web热点数据挖掘算法阮梦黎(山东管理学院信息工程学院,济南250100)摘要:随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻

2、优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。关键词:数据挖掘;半结构化;热点数据;大数据中图分类号:TP393文献标识码:A文章编号:1001—7119(2015)04一O115—03AlgorithmofWebHotDataMiningBasedonStructuredSegmentationRuanMengli(SchoolofInformationEngineeri

3、ng,ShandongManagementUniversity,Jinan250100,China)Abstract:Withthedevelopmentofbigdatainformationtechnology,onlinemonitoringdataanddatamininghasbecomeahotresearchfieldofcomputerinformation.ThesegmentationofWebhotdatamining,improvetheclassificationabilityofinformationfocusandWebdata.Us

4、ingthetraditionalalgorithmofunstructureddataminingalgorithms,itisnotvalidforWebhotdataforaccuratepositioningandlayeredmining.ThepaperproposedaminingalgorithmWebhotdatastructuredbasedonsegmentation,featuresegmentationusingsemistructureddata,excellentgenesarebasedondifferentialevolution

5、,maketheoptimizationcurvetendstobegentle,parallelonmultiplenodesrunningscript,throughthecodemakestheun—structureddatamappedtothedatablock,makethedatastoredinthedatabaserel~ionaldatamodel,togetthedistributionfactorWebhotdata,improvetheminingperformance.Thesimulationresultsshowthatthehi

6、gheficiencyandaccuracy,itimprovedadaptiveWebhotspotofdataminingoptimizationability.Keywords:datamining;semi—structured;hotdata;bigdata0引言据库系统中,要实现对数据高效访问,需采用动态Web技术,实现良好的访问接口,然后达到高效的数据使用在物联网、云计算和大数据高度发展的今天,信息目的。在动态Web上实现热点的引导工作,可以很好数据呈现指数级增长,人类快步进人大数据时代。对地利用动态Web的强大数据性能,结合多集合融合方Web热点数

7、据挖掘和引导是现代计算机和网络技术大法的优点,为热点引导服务。因此,通过对Web热点数力发展下进行信息交互和传播的重要手段。World据分割挖掘,提高信息热点追踪和Web数据分类能力,WideWeb(www)技术是随着计算机技术和网络技术快研究Web热点数据的挖掘算法受到人们广泛关注。速发展而日新月异的一种新技术,在Web中,信息数据本文首先分析了大数据环境下Web热点数据挖掘交织纷繁,整个Web网络系统中具有海量的数据供人分析的处理流程,提出采用半结构化数据进行特征分们使用和查询。这些大量的数据都存储在Web集成数割,同时借鉴基因表达式算法,充分考虑数据本身特性

8、收稿日期:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。