欢迎来到天天文库
浏览记录
ID:57731692
大小:250.98 KB
页数:5页
时间:2020-03-25
《_基于广州航海高等专科学校图书馆管理系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第21卷第12期农业图书情报学刊Vol.21,No.12第12200期9年12月JournalofLibraryandInformationSciencesinAgricultureDec.2009书目数据库主题词数据挖掘———基于广州航海高等专科学校图书馆管理系统陈瑷瑛(广州航海高等专科学校图书馆,510725)摘要:从分析当前图书馆书目数据库主题词字段数据特征入手,得出书目数据库普遍存在主题标引问题。提出采用DATAMINING(数据挖掘)技术对现有书目数据库主题词进行挖掘,探索出各类目下的主题词集,形成主题词表作为图书馆
2、书目数据库主题标引的参照。关键词:书目数据库;数据挖掘;频繁项目集;最小支持度中图分类号:G254文献标识码:A文章编号:1002-1248(2009)12-0121-04Descriptors’DataMininginBibliographicDatabase———BasedontheManagementSystemofGuangzhouMaritimeCollegeLibraryCHENAi-ying(Library,GuangzhouMaritimeCollege,Guangzhou510725,China)Abstra
3、ct:Fromanalyzingthefeaturesofdescriptorfileddatainlibrarybibliographicdatabase,wefindthewidespreadprob-lemsofsubjectindexinbibliographicdatabase.Weshouldadoptthetechnologyofdataminingtominetherecentbiblio-graphicdatabaseandexplorethedescriptorsetofeachcategory,tofor
4、mthethesaurusasthereferencetothesubjectindexofbibliographicdatabase.Keywords:bibliographicdatabase;datamining;frequentitemset;minimumsupport1图书馆书目数据库主题字段数据特征分析标引的一致性是指不同标引人员或同一标引人员[1]书目数据库,是各图书馆开展自动化业务所建在不同时期对同一主题的资源进行标引时,主题分析立的第一个数据库,既是图书馆计算机管理工作的中结果和概念转换的一致程度。在数据上
5、则表现为对同心资源库,又是当今数字化服务环境下被各类检索系一文献或相同主题的文献赋予相同的检索标识。书目统和知识“挖掘”工具进行资源分析的宝贵数字化资数据库主题标引主要存在着标引前后不一致或深浅度源。但是,在书目数据库的长期建设过程中,由于受不一致的问题,这是主题标引中的大忌。到的各种历史原因和技术条件的限制,使其在主题标在文献标引过程中,由于文献主题及其论述方式引方面存在着不一致、不标准、不完整等问题,导致千差万别,而不同标引人员对各种文献主题的内涵和书目数据库这一特色资源在知识管理和全球数字化服外延的理解不可能都相同,即使
6、是同一人在不同的时务中的作用直接受到影响。主题标引问题和中国语言期对某一问题的侧重点也可能产生不同的想法,这就文学所固有的修辞特性形成了我国图书馆书目数据库很可能造成同一主题内容的文献被配给不同的主题独有的数据特征,仔细分析主题词数据特征,有助于词。另一方面,为迎接普通高校(或高职高专)教学我们深入研究和探索问题形成的原因,以寻求在现有工作水平评估,许多高校图书馆都加大了纸本图书的条件下解决此问题的好方法。投入,由于图书馆采编部门的人力有限,为使新书及[2]1.1主题标引存在着不一致性时进库室流通,许多图书馆采取了让不懂图书分
7、编工收稿日期:2009-05-05基金项目:本文是广州航海高等专科学校2009校级课题《书目数据库主题词数据挖掘》的前期研究成果。作者简介:陈瑷瑛(1971-),学历本科,图书资料专业馆员,广州航海高等专科学校图书馆流通部,主任,已发表论文1篇,主要研究方向信息资源开发与利用。122农业图书情报学刊:工作研究第21卷作的书商按图书在版编目数据建库的做法,这更加重2采用DATAMINING技术研究书目数据库主题词了主题标引的混乱。种种原因造成图书馆普遍存在标DATAMINING[6]是目前国际上数据库和信息决引不一致的问题,特别
8、是计算机类文献的主题标引显策领域的最前沿研究方向之一,引起了学术界和产业得较混乱。界的广泛关注。随着数据库及数据库管理系统的广泛[2]1.2主题标引存在着不完整性应用,数据库中存储的数据量急剧增大。随着数据在主题标引的完整性是指书目数据库里每条书目记日常决策中的重要性越来越显
此文档下载收益归作者所有