中文社会科学引文索引质量问题研究

中文社会科学引文索引质量问题研究

ID:37346207

大小:384.85 KB

页数:5页

时间:2019-05-21

中文社会科学引文索引质量问题研究_第1页
中文社会科学引文索引质量问题研究_第2页
中文社会科学引文索引质量问题研究_第3页
中文社会科学引文索引质量问题研究_第4页
中文社会科学引文索引质量问题研究_第5页
资源描述:

《中文社会科学引文索引质量问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第31卷第1期情报杂志Vol.31No.12012年1月JOURNALOFINTELLIGENCEJan.2012中文社会科学引文索引数据质量问题研究张友谊刘春(重庆师范大学图书馆重庆400047)摘要中文社会科学引文索引(CSSCI)查询和统计功能的有效实现,是以数据的准确、规范为基础,笔者从数据结构和数据内容两个角度详细分析CSSCI的数据质量问题,并提出了改进建议,以期CSSCI进一步发展完善。关键词中文社会科学引文索引数据质量改进措施中图分类号G353.21文献标识码A文章编号1002-1965(2012)0

2、1-0021-04ResearchontheDataQualityProblemsofCSSCIZHANGYouyiLIUChun(LibraryofChongqingNormalUniversity,Chongqing400047)AbstractRealizationofthequeryandstatisticalfunctionsinChineseSocialScienceCitationIndex(CSSCI)isbasedontheaccurateandstandarddata.Fromthedatastr

3、uctureanddatacontent,theauthorsanalyzedataqualityissuesofCSSCIandproposethecorrespondingmeasuresforimprovement,withaviewtothefurtherdevelopmentofCSSCI.KeywordschinesesocialsciencecitationIndexdataqualityimprovements中文社会科学引文索引(ChineseSocialSciences检索结果下载数据结构详见表1

4、。CitationIndex,以下简称CSSCI)是由南京大学中国社从表1可看出,不同年代来源库下载记录结构存会科学研究评价中心开发研制的引文数据库,用来检在以下问题:索中文人文社会科学领域的论文收录和被引用情a.不同年代记录的字段数不同。2009提供的记[1]况。作为我国人文社会科学主要文献信息查询的重录多达19个字段,其他年代字段数在15-18间无规律要工具,填补了我国社会科学成果量化统计和评价工的变动,记录结构不统一导致的结果是研究者不能把具的空白,具有重要的科学价值和实际应用价值。各个年代下载数据合并在一起统

5、一进行格式转换处CSSCI查询和统计功能的有效实现,是以结构合理、著理,如果有多年数据要处理,只能先按年代把相同年份录准确规范的数据为基础,而笔者最近在利用CSSCI的下载数据(txt文档)合并在一起单独进行格式转换,统计分析数字图书馆主题文献的过程中发现,来自然后分别从每年的数据中抽取所需字段,导致工作效CSSCI的数据存在诸多质量问题,这些问题可大致分率大大降低。为结构和内容两个方面。b.字段名称不统一。比如同是著录来源文献篇名的字段,在2002-2004和2008中的字段名是“来源文1CSSCI数据结构存在的问

6、题献”,其他年份则叫“来源篇名”;同是存放文章分类号1.1年份数据结构问题很多数据挖掘工作不能的字段,在1999和2010中的字段名是“期刊代码”,其直接在CSSCI检索主界面实现,研究人员常需将检出他年份叫“中图类号”,而我们平常理解的“期刊代码”记录详情下载后按字段类别进行拆分、连接、归并等处是指期刊的CN号或ISSN号,2009年数据竟把该字段理,以达到特定统计分析目的。但笔者对比1998-名误为“中途类号”,显然是录入字段名时用拼音输入2010的来源文献库下载数据结构,发现各年代库提供法产生的失误。在同一检索

7、系统中,相同字段相同名的记录结构差异极大,字段个数不等,名称不统一,甚称应是最基本的规范要求。至个别字段名称都弄错。1998-2010各年代来源库的c.字段名称指代不清。比如“标引词”这一字段收稿日期:2011-08-06修回日期:2011-12-16作者简介:张友谊(1978-),女,硕士,馆员,研究方向:信息咨询;刘春(1972-),男,硕士,馆员,研究方向:网络信息检索。·22·情报杂志第31卷表1来源库各年代下载记录的字段构成年代记录的字段构成字段数文件序号、来源篇名、英文篇名、来源作者、文章类型、基金、期刊

8、、第一机构、机构名称、学科分类、第一作者、中图类199815号、年代卷期、标引词、参考文献文件序号、来源篇名、英文篇名、来源作者、文章类型、基金、期刊、第一机构、机构名称、学科分类、第一作者、期刊代199915码、年代卷期、标引词、参考文献文件序号、来源篇名、英文篇名、来源作者、文章类型、基金、期刊、第一机构、机构名称、地区、学科分类、第一作者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。