以web数据库为基础的数据库挖掘技术分析

以web数据库为基础的数据库挖掘技术分析

ID:28284969

大小:66.50 KB

页数:6页

时间:2018-12-09

以web数据库为基础的数据库挖掘技术分析_第1页
以web数据库为基础的数据库挖掘技术分析_第2页
以web数据库为基础的数据库挖掘技术分析_第3页
以web数据库为基础的数据库挖掘技术分析_第4页
以web数据库为基础的数据库挖掘技术分析_第5页
资源描述:

《以web数据库为基础的数据库挖掘技术分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、以Web数据库为基础的数据库挖掘技术分析摘要:在科技的推动下,网络技术取得了很大进步,人们对信息的需求量越来越大,获取信息的渠道也呈现出多样化,数据库技术在此背景下迅速发展。与一般的数据库不同,Web数据库包含大量的信息资源,结构较为复杂,要想对其展开更深层次的研究,需要用到数据库挖掘技术。本文对此进行了简要分析。关键词:Web数据库;数据库挖掘技术分类号:TP311.13互联网是人类快捷获得信息的一种重要渠道,为社会做出了巨大贡献,随着经济技术的进步,互联网越来越复杂,在当前时代,既是机遇,也是挑战。信息资源数据库对信息的储存和查询很有

2、帮助,使人们能够更为方便地获得所需信息,当Web技术与数据库系统相结合后,信息的开放性也引发了信息的安全质量问题,因此,需要对Web数据库进行深度挖掘,以更好地为人们服务。1Web数据库及数据库挖掘技术1.1Web数据库近些年来,网络技术已深入到社会各个角落,数据库系统也有了极大的进步,将两者相结合来开发Web的深度资源已成为当前重点研究的问题。Web数据库技术是一种以Web查询接口方式对数据库资源进行访问而且能够实现远程操控的技术,通过数据库与Web的连接可以产生一个在任何地方皆可操作的动态页面,即对核心数据库的信息资源进行查询,系统会

3、以Web页面作为访问接口,并将查询结果以Web页面的形式展现出来。目前的Web数据库通常有数据收集、数据供应以及元搜索三种集成方式。1.2数据库挖掘技术在当前信息化时代,人们的信息需求量骤增,信息资源储存量也不断扩大,加大了查询的难度,因此,如何在最短时间内获得所需信息是当前必须考虑的问题。深度挖掘技术具有关联分析、偏差分析以及分类等功能,能够从随机的海量数据中提取潜在有用的信息资源。须注意的是,并非每一个数据库信息的发现都是数据挖掘,如查询数据库管理系统中的记录等属于信息检索的领域。数据库挖掘技术在不断地改进,为进一步实现信息的传递,该

4、技术融合了模式识别、统计学、进化计算以及搜索建模等知识。1Web数据库挖掘技术分析2.1数据的预处理挖掘效果取决于被挖掘数据的质量,在实际采集中,数据存在着很多问题,如不完整性;在异常数据较多的情况下,常会带有噪声;数据的不一致性也是较为常见的问题,如数据名称的差异等。因此,预处理就显得尤为重要,在数据挖掘中的作用不可小觑,尤其是挖掘一些有残缺的数据资源时,为了提升挖掘质量,务必要提前对所挖掘的数据对象进行预处理。2.2模式识别挖掘技术具有相关分析及计算的功能,模式识别即是借助统计法对识别的结果进行挖掘计算。实现算法可以采取一般的统计方法

5、,也可以利用其他形式的结果,主要包括页面的浏览时间、访问次数以及统计分析等。在此阶段,关联规则的作用是发现用户访问的各个页面之间的关系。当利用浏览器对相关Web站点进行访问时,可建立相应的模型,以方便统计用户的访问模式。2.3模式分析该环节即是采取科学的技术方法以及必须的操作工具对挖掘结果中的用户模式进行分析,经过对比,选择最为合理的模式,进而更好地对数据信息进行理解,充分利用各种用户模式。同时,在此阶段,有些比较特殊的信息结构,能够滤除诸如特定数据或超链接网页等模式。从当前的统计结果看,大约有30种商业性质的Web分析工具,合理地利用这

6、些工具,有利于获得更多的信息,包括网页点击率、用户群特点及用户爱好等信息。须注意的是,这些数据在使用时常会很多问题,如维护较难、不够灵活、结果准确度得不到保障等。1Web数据库挖掘方法及应用2.1挖掘方法(1)粗集方法该方法对信息的要求较为简单,而且便于运算表达,但准确度上稍有瑕疵。利用该方法处理信息对象,和二维关系有所相似。连续属性在数据库信息表中较为普遍,而集合论是该方法的数学基础,采用粗集法不能直接处理一些连续的属性,因此,尽管数据库技术有了很大进步,为挖掘技术提供了必要的前提条件,但在实际操作中还是会有很大的制约。(2)模糊集方法

7、该方法主要是在解决一些实际问题时,利用模糊集合理论对其进行的模糊识别分析。通常来说,数据库系统越是复杂,模糊性越强,在描绘模糊事物的属性时,模糊集合理论多采用隶属度进行。随着研究的进一步加深,以传统的模糊理论为基础,结合概率统计,专业研究人员提出了一种新的模型,即云模型,并建立了相应的云理论。(3)覆盖正例排斥反例的方法该方法的理论思想即是指覆盖所有的正例,或者排斥所有的反例,以此来寻找内在的规律。具体方法如下,在正例集合中任意选择一个正例种子,与反例集合中的所有种子逐一比较,若与字段取值构成的选择相容,则将之去除;若相反,则将其保留。按

8、照这种方式对全部正例种子进行选择,最终得到正例的规则。(1)统计分析法一般而言,数据库的字段之间有函数和相关两种关系,利用统计学分析法可对二者进行仔细分析,即对统计学理论加以运用,从而更好地分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。