欢迎来到天天文库
浏览记录
ID:46285498
大小:67.00 KB
页数:7页
时间:2019-11-22
《Web数据库当前探究及应用现状概述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、Web数据库当前探究及应用现状概述摘要:Web数据库是当前研究是热点方向之一,其应用的范围和程度也相当广泛,几乎涉及到各个行业。本文对当前Web数据库的研究与应用做一个梳理,以得到一个较清楚的认识。关键词:Web数据库;研究;应用中图分类号:TP311文献标识码:A文章编号:1007-9599(2012)07-0000-02随着Internet的飞速发展,网上的数据资源空前丰富,数据的传播速度也在迅速增加。“Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,Web是对WWW资源中蕴涵的、未知的、有潜在应用价值的模式的提取。它反复使用多种数据挖掘算法从观测数据中确定模式或合理模型,
2、是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。”[1]基于此,本文从Web数据库的研究与应用做一下概述。一、关于Web数据库的研究对于Web数据库的研究,学术界主要集中在对Web数据的挖掘方面,包括Web数据挖掘的内容、Web数据挖掘的结构和Web数据挖掘的使用。(―)Web数据挖掘的内容"Web挖掘就是运用数据挖掘技术在Web文档与服务器自动发现并提取有用信息。它是数据库、信息检索、人工智能、机器学习与自然语言处理等几个相关研究领域的聚合。”[2]在内容挖掘上,它是对大量文档的集合进行总结、分类和分析并获取有用信息,它实际上是将数据挖掘技术应用在计算机网络上进
3、行信息处理。对象主要是针对网上的各种非结构化数据,如文本数据、音频数据、图形数据等多媒体数据进行处理,包括文本信息和多媒体信息的挖掘。目前,对Web数据挖掘的内容一般有两个观点,一是从资源(IR)查找来看,“Web内容挖掘的任务是从用户的角度出发,怎样提高信息质量和帮助用户过滤信息。”二是从数据库(DB)来看,“Web内容挖掘的任务主要是试图对Web上的数据进行集成、建模,以支持对Web数据的复杂查询。”在结构挖掘上,Web结构挖掘通过分析一个网页的链接和被链接的数量以及对象建立Web自身的链接结构模式,以从WWW的组织结构和链接关系中找到有用的信息,并推到出知识。它不仅包括在页面间采
4、用一种超链接的方法,从一个页面指向另一个页面的超链接,也包括以HTML或XML表示的树形结构,文档URL的目录路径结构,WWW中含有丰富的信息,用户需要根据自己的需要去寻找相关信息。Web结构挖掘有着广泛的应用,主要有:指导采集网页、聚类检索结果、识别社区团体、自动分类资源等。在使用挖掘上,它用于预测用户在Web上交互式信息查询中的行为,可以帮助用户更有效地找到信息,还可以帮助优化资源的分配。根据应用的不同,可以将Web使用挖掘分为两种主要倾向,即:一般的访问模式跟踪与定制的访问模式跟踪。“一般的访问模式跟踪通过分析Web访问日志来理解访问模式与倾向,利用这些分析可以清楚地给出较好的W
5、eb结构及资源提供者的分组情况。”''定制使用跟踪可以分析个人的嗜好与倾向,在显示的信息,网站的结构与资源的格式等方面进行动态地定制以为每个用户构建符合其个人特色的Web站点。”挖掘过程分为四个阶段:数据釆集,预处理,模式发现,模式分析。“根据对数据源的不同处理方法,Web用法挖掘可以分为两类,一类是将Web使用记录的数据转换并传递进传统的关系表里,再使用数据挖掘算法对关系表中的数据进行常规挖掘;另一类是将Web使用记录的数据直接预处理再进行挖掘。”(二)Web数据挖掘的特点半结构化特点:所谓半结构化是相对于结构化和非结构化而言的。半结构化数据模式有以下特征:(1)先有数据,后有模式。
6、(2)半结构化数据的模式是用于描述数据的结构信息,而不是对数据结构进行强制性的约束。(3)半结构化数据的模式是非精确的,它只可能描述数据的一部分结构也可能根据数据处理的不同阶段的视角不同而异。(4)半结构化数据的模式可能规模很大,甚至超过源数据的规模,而且会由于数据的不断更新而处于动态变化过程中。[3]、关于Web数据库的应用Web数据的应用范围非常广泛,可以说渗透到了人们学习工作生活的各个角落,而且以此为基础,开发出了各种程序,大大提高了人们的工作效率,方便了人们的生活。本文以几个例子来简单阐述Web数据的应用情况:(一)Web数据在网络教学中的应用计算机应用到教学领域,使教学模式、
7、教学思想、教学过程、教学方法、乃至教学的组织都发生了重大的变革。作为一种新的教学方式,计算机网络教学不受时空限制的,并且是交互式和图文并茂的,可以让学生更直观地理解和领会教学的内容,而且最大优势是可以实现远程教学。首先,Web网络教学系统的结构框架和设计,以教学课件模型设计及环节的功能和相互关系为中心。课件的设计要考虑参与教学活动的主体(人、计算机或者两者的结合),也要考虑到客体,即数据的存储,数据流和控制流的设计,而系统指导和知识库是课件设计
此文档下载收益归作者所有