数据挖掘技术在高校网站信息的应用.doc

数据挖掘技术在高校网站信息的应用.doc

ID:61795354

大小:28.00 KB

页数:4页

时间:2021-03-20

数据挖掘技术在高校网站信息的应用.doc_第1页
数据挖掘技术在高校网站信息的应用.doc_第2页
数据挖掘技术在高校网站信息的应用.doc_第3页
数据挖掘技术在高校网站信息的应用.doc_第4页
资源描述:

《数据挖掘技术在高校网站信息的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据挖掘技术在高校网站信息的应用摘要:随着计算机网络技术的日益发展,而数据挖掘技术在高校网站信息当中的实践应用已经到了一个比较成熟的阶段。网站作为信息传播的主要载体,运用其直观形象的使用方式,见证网络信息的快速发展,在既能够给予人们便利的情况下,也相应的给相关机构带来了巨大挑战。本文将针对高校针对网站规划以及网站建设方面,运用数据挖掘技术进行实践应用的内容,做相关阐述。关键词:数据挖掘技术;高校;网站信息;实践应用随着教育信息化的发展,高校网站建设已经从形象建设转变为现如今的信息建设,这主要是因为当今社会是信息时代,

2、高校用户对于信息的需求量也在与日俱增。也就是说在内容和数据方面都被要求需要达到较高的水平,在高校信息化建设的目标前提下,使用数据挖掘技术来帮助设计人员针对高校网站数据进行挖掘,从而找到适合高校网站建设的一种模式,在大量的信息中为人们提供有价值的信息以保证良好的服务。1相关概念4学海无涯1.1数据挖掘技术。数据挖掘技术在实践中体现出一种较强的综合性,它既能够针对网站设计来对数据实现有效采集,还能够通过技术本身来对网站数据来进行初步整理。也就是说数据挖掘技术能够在归纳式的推测前提下来针对用户进行预测,从而使得决策更加准确

3、。数据挖掘技术涵盖众多学科方面的内容知识,不仅包含数据库技术和信息获取技术,在某些时候还会使用到统计学的相关技术[1]。根据数据挖掘技术所面对的处理对象的不同,它分别有三种应用模式,其在各个行业发挥着不同的重要作用,第一个就是结构挖掘,第二个则是内容挖掘,第三个是使用挖掘。在数据挖掘技术实践过程中比较常用的,有关联规则技术,序列模式技术以及数据挖掘当中特有的路径分析技术[2]。网站数据本身相对于传统的数据库,其有着数据内容庞大且复杂的特性,并且它并没有以规定的数据模型呈现出来,所以网站数据内容当中,每一个站点都必须采

4、取独立设计,这也就导致了,在网站数据背景下的数据挖掘技术也比每个结构化数据都要更加复杂[2]。1.2数据处理。针对现实的网站数据,可以发现半结构化是网站数据的典型特点,所以要想解决半结构化数据源模型,在数据挖掘技术当中已经成为了最重要的问题之一[3]。这将对网站的数据模型进行重新定义,也就是说需要针对半结构化模型当中所需的相关数据进行自动检索,通过数据挖掘来应用半结构化数据模型抽取技术和半结构化模型,这也是数据挖掘技术当中的重要环节[4]。半结构化的数据模型是以一种xml的新型元标注语言为数据基础的,其数据描述与对应

5、的关系,数据库当中的属性可以实现1对1,并且在这个过程中的网站建设是相对来说较为容易的,可以在这样的基础上针对数据模型进行精确查询。与此同时,该新型元标注语言的开源代码也是较为丰富的,在它的应用下将大大的降低网站工作人员的工作成本,通过相应的技术与条件帮助解决网站数据半结构化分析困难的主要问题。2具体应用2.1数据的收集与整理。对数据进行大量的收集是数据挖掘当中的重点组成部分,但是因为表达方式不同,往往会造成数据挖掘当中存在一定的不确定性。所以就需要针对数据来做好相应的简单处理,确保数据能够受到专业化的提取与进净化。

6、为相关设计人员提供网站数据基础,让他们能够获得应有的有用信息,从而在数据挖掘过程中提高工作的质量效率与水平。综上所述,数据预处理就是用户针对网站进行访问时所需要的最原始的数据库内容。高校网站的服务器能够针对用户访问的次数跟时间来进行记录,用户访问的数据将会被网站日志进行记录,所以网站日志就是得到数据最简单直接的方法之一。可以通过网站日志来对这些内容做好简单记录,其中包含用户名、浏览日期等方面的内容。但是在实践操作过程中,会发现网站日志,对于他自身所收集到的信息也有存在不准确的情况,所以如果直接的对其进行利用往往是不可

7、取的,所以需要针对相应数据做好一定的处理才可以确定相关内容。其中包含针对浏览界面的确定以及用户与用户的访问序列的确定,还有对用户的访问路径进行完善等方面的内容,如果对信息的质量要求较高的话还需要高校网站能够形成专门的数据库。2.2数据模式的发现。要想发现数据模型,就必须运用数据挖掘的4学海无涯算法,可以通过针对页面的网页浏览量设计来确定网页的浏览数。产生的结果,在相关人员对此进行有效测量的情况下,能够对时间序列建模和时间序列的预测情况进行具体了解,从而分析出时间序列的主要目标。整体的趋势与长期运动的规律都是需要观察的

8、点,在时间序列当中周期运动又或者是周期性变动,也是需要重点关注的要点之一。上述内容都是趋势分析当中的关键所在。此外在针对页面访问进行统计的过程中能够发现,往往排名靠前的都是对于高校网站首页的访问,也就是说大部分的高校用户都是通过浏览器收藏夹的资源定位来对网站进行访问的。在此情况下进入到高校网站访问当中,只能基本上就是对第一个页面进行大致的浏览。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。