资源描述:
《web挖掘在图书馆网站建设中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Web挖掘在图书馆网站建设中的应用2006年12月大学图书情报学刊第24卷第6期JournalofAcademicLibraryandInformationScienceDec,2006V01.24No.6Web挖掘在图书馆网站建设中的应用袁亮环徽中医学院,合肥230038)摘要:文章指出高校图书馆网站是开展读者服务和信息服务的重要手段,提出利用WEB挖掘技术来发现隐藏在WEB中的信息,以便改进网站的建设,为读者提供更好的信息服务.关键词:网站建设;Web挖掘;信息服务中圈分类号:G259.23文献标识码:B文章编号:1006-1525(20
2、06)06-0tm4~TheapplicationofWebminingintheconstructionofwebsitesinlibrariesYUANLiang-huan(AnhuiCollegeofChineseTraditionalmedicine,Hefei230039,China)Abstract:Thewebsitesinauniversitylibraryisanimportantmethodincarryingoutthereaderserviceandtheinformationservice.Theauthorofth
3、isarticleadvancesasuggestionthatinformationhiddeninWebshouldbediscoveredbyusingWebmirIingtechnologyinordertoimprovetheconstructionofwebsitesandprovidethebetterinformationserviceforthereaders.Keywords:websiteconstruction;Webmining;informationservice高校图书馆网站是图书馆自动化信息系统的重要组成部分,
4、它是图书馆资源,服务与读者之间的桥梁,是揭示馆藏资源和提供信息服务的重要工具,为用户获取信息,交流信息提供了基于Web的信息服务平台.图书馆网站是图书馆与读者信息沟通与交流的虚拟和载体,是网络环境下开展读者服务和信息服务的窗口和重要手段,规划和建设好图书馆网站,是图书馆的一项重要工作.建立一个网站并不困难,困难的是如何节约读者的时间,让读者更快地找到其所需的内容;怎样了解读者的需求,并提供其感兴趣,对读者帮助最大的信息;如何利用有限的人力和物力资源为读者提供更优质服务.由于每个读者对信息的需求不同,网站设计人员的思维习惯不同,各院校的专业设置
5、,科研水平,教学水平等具体情况也不尽相同,因此很难确定何种风格,结构,内容的网站是否合理.也就没有一个统一的标准来衡量网站的建设质量.如何设计—个结构合理,内容真实,能满足大多数读者需求的网站是网站设计维护人员必须考虑的问题.每个Web站点都是—个数据源,这些数据可以看作广泛意义上的数据库,相比传统意义上的数据收稿日期:2006-06-29作者简介:袁亮环男.馆员.40库,更大更复杂.因此,可以将传统的数据挖掘技术与Web的使用相结合来发现隐藏在Web中的信息,以便改进网站的建设,为读者提供更好的信息服务..1基于Web的数据挖掘数据挖掘就是
6、从大量不完全的,有噪声的,模糊的,随机的实际应用数据中发现隐含的,规律性的,人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程.而基于web的数据挖掘则是将web的使用与传统的数据挖掘结合起来,从与WWW相关的资源和行为中抽取感兴趣的,有用的模式和隐含信息的过程.通过web挖掘分析,可以为网站运行提供深入,准确,详细的分析数据和有价值的以及易理解的分析知识.从应用的角度看,web挖掘任务可分为:(1)分析系统性能的web挖掘任务;(2)改进web站点设计的web挖掘任务;(3)向用户提供个性化服务的web挖掘任务.以分析系
7、统性能为目标的挖掘任务主要从统计学角度对日志数据项进行各项统计,如频繁访问页,访问数据量随时间分布等.袁亮环:Web挖掘在图书馆网站建设中的应用以改进Web站点设计的web挖掘任务以日志数据为依据,对Web服务器的组织和表现形式进行分析,从网页的链接结构中获取有用的知识.利用这些信息,可以对页面进行排序,发现重要的内容页面,重新组织内容结构,使内容逻辑结构更加合理.以向用户提供个性化服务的web挖掘任务主要通过挖掘相应站点的日志文件获取访问者的访问内容,停留时间,访问频度等,发现其访问模式等有用信息的过程.数据挖掘是一个利用各种分析工具在海量
8、数据中发现模型和数据间关系的过程,利用这些模型和关系可以进行预测,它帮助决策者寻找数据间潜在的关联,发现被忽略的因素.基于Web数据挖掘的数据主要包括以下三类:用户