基于自然语言的apriori关联规则的视觉挖掘方法

基于自然语言的apriori关联规则的视觉挖掘方法

ID:9379657

大小:1.09 MB

页数:16页

时间:2018-04-29

基于自然语言的apriori关联规则的视觉挖掘方法_第1页
基于自然语言的apriori关联规则的视觉挖掘方法_第2页
基于自然语言的apriori关联规则的视觉挖掘方法_第3页
基于自然语言的apriori关联规则的视觉挖掘方法_第4页
基于自然语言的apriori关联规则的视觉挖掘方法_第5页
资源描述:

《基于自然语言的apriori关联规则的视觉挖掘方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于自然语言的Apriori关联规则的视觉挖掘方法摘要:抽象-可视化数据挖掘技术可以以图形方式向用户展示数据挖掘过程,从而使用户更易于理解挖掘过程及其结果,而且在数据挖掘中也非常重要。然而,现在大多数视觉数据挖掘都是通过可视化的结果而进行的。同时,它不适用于关联规则的可视化处理的图形显示。鉴于上述缺点,本文采用自然语言处理方法,以自然语言视觉地进行Apriori关联规则的整体挖掘过程,包括数据预处理,挖掘过程和挖掘结果的可视化显示为用户提供了一套具有更多感知和更易于理解的特征的集成方案关键字:apriori关联规则数据挖掘可视化1引言视觉数

2、据挖掘技术是可视化技术和数据挖掘技术的结合。使用计算机图形、图像处理技术等方法将数据挖掘的源数据,中间结果和最终挖掘结果转换成易于理解的图形或图像,然后进行贯穿的理论,方法和技术交互式处理。根据数据挖掘应用中可视化的不同阶段,数据挖掘的可视化可以分为源数据可视化,挖掘过程可视化和结果可视化。(1)源数据可视化源数据可视化方法在数据挖掘之前,以可视化的形式将整个数据集呈现给用户。目的是使用户能够快速找到有趣的地区,从而实现挖掘目标和目标的下一步。(2)过程可视化过程可视化实现起来相当复杂。主要有两种方法-一种是在采矿过程中可视化地呈现中间结果

3、,并使用户根据中间结果的反馈方便地调整参数和约束。另一种方法是以图标和流程图的形式保持整个数据挖掘过程,根据用户可以观察数据源,数据集成,清理和预处理过程以及采矿结果的存储和可视化等等。(3)结果可视化数据挖掘结果可视化是指在采矿过程结束时以图形和图像的形式描述挖掘结果或知识,以提高用户对结果的理解,并使用户更好地评估和利用采矿结果。2、国外家庭视觉数据挖掘研究状况目前,视觉数据挖掘技术的研究在国内外都处于起步阶段,如何使用可视化技术来显示利用各种数据挖掘算法生成后的模型。该方向的主要研究内容是通过一些特殊视觉图形中的关联规则、决策树和聚类

4、等算法向用户显示生成的结果,以帮助用户更好地了解结果数据挖掘模型。典型的业务应用程序是IBMSPSSModeler,开源工具包括Weka、Orange、GGobi和KNIME,以及GoogleVisualPublicPlatform:PublicDataExplorer。视觉数据挖掘工具是一种很好的数据分析工具,在行业应用中,使用可视化数据挖掘工具显示数据挖掘更为明确,结合数据挖掘技术,更有利于分析的数据挖掘结果。目前,关联规则的可视化研究主要集中在可视化数据和关联规则结果上,而挖掘过程可视化存在很多缺陷。特别是在视觉演示过程中,基本采用图

5、形形式。在实践中已经发现,图形方法不适合在过程中显示关联规则及其结果。因为对于关联规则,我们的目的是找到频繁的项目集,最好的结果显示它们是文本,同时对于最终获得的关联规则,图形应用程序不能够很好地显示,最好的方法是用基于自然语言的方式显示应用程序。本文提出了基于自然语言的Apriori关联规则的视觉挖掘方案。该方案的预处理,中间过程和采矿结果各个方面均可视化。旨在通过最可接受的自然语言作为工具,实现整个采矿过程的视觉演示。3基于APRIORI协会规则的可视化采矿的基本理念本文提出的关联规则的视觉挖掘基本思想是在数据挖掘的整个过程中,提前提出

6、关联规则的视觉挖掘基本上是关于采矿结果可视化的,很少涉及中间和预处理过程中的可视化。对于结果可视化,图形方法是主要采用的显示方式,如使用平行坐标法,有向图法等。然而,对于关联规则,通过频繁项目集和关联规则的方式进行图形显示似乎无能为力。协会只是反映规则,规则最直接的形式是使用自然语言,而奥术公式和图形对于那些非常专业的人员而言是可以理解的,不适合普及。而且,当然,充分运用反映关联规则的自然语言对实现有一定困难。在本文中,采用自然语言的形式,以视觉方式展示了整个采矿过程。可视化过程如图1所示图1关联规则的视觉过程表1数学分数变换规则序号条件等

7、级A1Math>=85优A2Math>=60andMath<=85中A3Math<60差(1)数据预处理数据预处理是整个数据挖掘的关键,也是第一步,一般程序自动完成工作并显示差异。本文采用完全互动的预处理操作可视化方法,首先构建用户定义的自然语言转换规则库,易于编辑规则,其最终目标是将属性值转换为自然语言。例如,表1可以被定义为这样的规则,根据得分值,不同的分数可以被转换成不同的代码。(2)采矿过程挖掘过程的可视化主要体现在中间挖掘结果的视觉显示和用户与系统之间的相互作用。对于关联规则,中间挖掘结果体现在频繁项集合的显示中,以供用户观察采矿

8、过程正确或不正确,同时根据交互程序,用户可以及时地介入方案进行运作(3)采矿结果挖掘结果可视化主要是基于最大频繁项集来提取关联规则,并通过转换规则将编码关联规则转换为自然语言形式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。