基于高频关键词统计的“域级整合”分析方法研究

基于高频关键词统计的“域级整合”分析方法研究

ID:20866443

大小:51.53 KB

页数:11页

时间:2018-10-17

基于高频关键词统计的“域级整合”分析方法研究_第1页
基于高频关键词统计的“域级整合”分析方法研究_第2页
基于高频关键词统计的“域级整合”分析方法研究_第3页
基于高频关键词统计的“域级整合”分析方法研究_第4页
基于高频关键词统计的“域级整合”分析方法研究_第5页
资源描述:

《基于高频关键词统计的“域级整合”分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于高频关键词统计的“域级整合”分析方法研究[摘要]在介绍几种主要的词频统计分析方法基础上,提出基于高频关键词统计的“域级整合”方法,阐述“域”、“级”的理论基础和划分依据,以图书情报学科的三个样本实例具体说明“整合”分析方法,给出图书情报学高频关键词域级综合表以及高频关键词共现图模板,分析这种方法的应用研宄价值。[关键词]词频统计关键词统计计量分析域级整合分析方法[分类号]G3501引言词频统计(wordfrequencystatishca)方法的一个重要应用领域是通过统计分析词频变化规律,预测学科、行业、技术

2、的发展趋势。同频统计采用的具体统计分析方法主要有:①单关键词法,即根据大量单个关键词的增减变化规律统计分析。②共词分析法,有两种,第一种是包容地图和临近地图法,即根据若干指数计算结果,把关键词聚类成组,以网络地图的方法表现出来;第二种是基于战略坐标的共词分析,即共词矩阵和聚类结果的可视化方法。③词对关键词法(严格意义上也是一种共词方法),即以两两成组共现的成对关键词代替单个关键词,通过建立共词矩阵并进行标准化后,作统计分析。本文在深入研宄上述方法的基础上,提出一种基于高频关键词统计的“域级整合”分析方法,并作具体

3、阐述。2“域级整合”分析方法的理论基础及其整合设计2.1“域”、“级”概念的理论基础和区分依据2.1.1“域”、“级”概念的提出用关键词统计方法来研究和预测一个学科的态势,除了总体考察关键词数量变化外,还要考察关键词在表达事物主题(点)上的类型特征、词间组合(面)上的属分关系,从两个方面对高频关键词作组合聚类和关联程度研宄。共词分析方法中的共词矩阵和多种指数、系数聚类方法主要从数学意义上解决组合聚类和词间关联程度的界定笔者认为,在得到一组高频关键词后首先应从人类思维和人文意义角度作宏观聚类和关系定位,因此,就形成

4、了对应于“点”和“面”概念的“域”与“级”的分析设计思路。2.1.2“域”__按意义划分的主题相关关键词组合任何学科研宄都是由若干不同划分标准形成的主题研究集合。就研究对象而言,图书馆学有“管理说”、“要素说”、“信息说”、“知识说”。就研究层面而言,有传统图书馆研宄和数字图书馆研宄等。近年来图书馆学研究有了新的变化,图书馆研究“要素”被赋予新内涵,信息资源研宄得到重视,知识管理理论影响到图书情报学研究,图书馆进入了数字化发展阶段,数字图书馆成为图书馆研究的重要方面。结合这些变化,本文提出现阶段图书馆学研宄关键词

5、的四大分布区域:传统区、信息区、知识区和数字区。2.1.1“级”__同区域内关键词出现的频次范围划分按照人们的思维习惯,关键词标引一般从大概念到小概念逐级标引,故图书馆、高校图书馆、公共图书馆这些大概念词总是呈现最高频次。设计关键词的“级”,把关键词的频度与“上下位类”关系联系起来,揭示关键词频度与词间概念组合属分关系,在进一步聚类分析时,使每个关键词在系统中按照域和级两个维度找到位置,从而为实证分析的解读提供支撑。本文提出关键词研宄的统一为4级区分方案,即以同类期刊或期刊群为研宄对象,确立采集时间段,得到高频关

6、键词样本组后,一律按照4级划分级。分级的区分点确定:①关键词的频次分布图形的突变点;②同级内高频关键词数量基本符合减连续分布;③依据高频关键词含义适当人为干预调整。2.1“域级整合”分析方法的整合设计2.2.1样本采集本文以《中国人文社会科学学术影响力报告(2000—2004)》、《1999—2008我国图书馆学研究的实证分析(下)》和笔者自行统计的《中国图书馆学报》给出的高频关键词为样本。这三个样本的关键词来源在刊物种类上既具广泛性又有代表性,高频关键词的选定上也具有较强的科学性,时间跨度基本上为近10年。2.

7、2.2样本整合分析按照4个主题区域、4个级别对每个样本内的关键词根据所属“域”和相对词频数的“级”分别列表归类,同区域同级内关键词按词频次数从高到低定位。为方便对三个样本关键词进一步整合,对每个样本的关键词作两两比较,采取改变字体和在关键词旁加标记的方法,标明样本之间关键词的重复(见表1和表2)。用同样的研宄方法,笔者对《中国图书馆学报》2006-2010年间高频关键词也进行整合分析。《中国图书馆学报》2006-2010年载文607篇,实际使用关键词1382个,2474次,经过统计筛选和整理,获得高频关键词(4次

8、以上)共72个。“图书馆”作为通用词删除,实际为71个。以上三样本的高频关键词总数为229个。2.2.3样本整合成果分析分别观察各样本表,可见关键词按词频分级后能够直观观察研宄层次。同级关键词表达的主题概念也基本是同级的,如表2中的信息资源一信息资源建设一资源整合等。比较发现,三个样本尽管相对词频差别很大,分级档次相去甚远,但是绝大多数相同关键词都被至少两个样本列在了相同

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。