欢迎来到天天文库
浏览记录
ID:5230052
大小:31.50 KB
页数:9页
时间:2017-12-06
《基于社会网络研究与共词研究国内关联数据探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于社会网络研究与共词研究国内关联数据探究 摘要:文章选取CNKI数据库收录的相关关联数据研究文献,利用SATI软件构建共词矩阵,使用社会网络分析软件Ucinet和社会科学统计软件SPSS绘制知识图谱和聚类树状图,对关联数据领域作者共现和高频关键词共现进行分析,揭示出国内关联数据研究现状与未来发展趋势。关键词:关联数据社会网络分析共词分析UcinetSPSS中图分类号:G254文献标识码:A文章编号:1003-6938(2013)05-0129-04关联数据(LinkedData)概念由“万维网之父”TmiBerners-Lee于2006年首次提出[1]。关联数据是语义web的
2、主题之一,描述了通过可链接的URI方式来发布、分享、连接Web9中各类资源的方法。关联数据通过网络把以前没有关联的相关数据链接在一起,允许用户发现、关联、描述并再利用各种数据,因而自关联数据提出以来便得到了社会广泛的认同和快速的发展,BBC、纽约时报、美国国会图书馆等都纷纷加入到关联数据的出版发布之列[2],关联数据也日益成为国内学术界的关注热点。因此本文运用社会网络分析方法和共词分析方法,通过关联数据领域作者合著网络、关键词共现网络和关键词共词聚类分析,了解我国关联数据研究团队发展现状、研究热点和内容结构,以期为后续研究与实践的开展提供参考。1数据来源与研究方法1.1数据来源本
3、文选取CNKI的中国学术期刊网络出版总库为数据来源库,以“关联数据”或“linkeddata”为检索词在主题字段检索,检索时间是2013年4月10日,剔除重复和非相关文献后得到有效学术论文117篇。1.2数据处理工具在共词分析和社会网络分析方法中,数据处理是十分重要的步骤。使用浙江大学信息资源管理系刘启元开发的文献题录信息统计分析工具(StatisticalAnalysisToolkitforInformetrics,SATI)。该软件通过对期刊全文数据库题录信息的字段抽取、频次统计,进而生成共现矩阵。生成的共现矩阵可以直接导入Ucinet和SPSS软件进行处理分析[3]。1.3
4、研究方法本文运用社会网络分析法生成作者合著网络和关键词共现网络图谱来分析关联数据领域的作者合著关系及学科的研究热点;运用共词聚类分析法生成共词聚类树状图来分析关联数据研究论文的主流研究领域的结构及其关系。2构建共现矩阵将从CNKI中导出的Endnote格式的文献题录信息导入9SATI软件,分别选取作者和关键词字段,进行抽取和频次统计,构建高频作者合著共现矩阵和高频关键词共现矩阵,保存为Excel文件,便可直接导入Ucinet和SPSS进行处理分析。3高频作者合著分析3.1高频作者合著网络分析打开Ucinet导入Excel格式的高频作者共现矩阵,利用Ucinet软件集成的可视化工具
5、Netdraw绘制高频作者合作关系网络图,通过K-cores分析,将所有节点分类,选择Transform—nodeattributeeditor9添加节点的大小和连线的粗细对网络进一步调整后,得到高频作者合著网络图谱(见图1)。图中每个节点代表作者,节点越大代表著者的频次越高,节点之间的连线粗细表示作者之间的合作强度。图中最大的团体是上海图书馆和广东外语外贸大学图书馆为合作机构下的刘炜、夏翠娟、张春景、赵亮、钱国富,在该合著网络中频率达到最高。该团体以刘炜和夏翠娟为代表围绕国家社会基金项目“关联数据的理论和应用研究”和“《资源描述与检索》的中文化及其应用研究”对关联数据发布技术及
6、其实现、开放应用协议、RDA进行了研究;四川大学和中国医学科学院医学信息研究所为合作机构下的范炜、方安、洪娜和邹庆围绕国家社会科学基金项目“关联数据中潜在知识关联的发现方法研究”对生物医学关联数据研究、语义管道技术、词表资源关联化、术语服务进行了研究;以中国科学院国家科学图书馆和中国科学院研究生院为合作机构下的的李春旺、黄永文、刘媛媛和邓兰兰等人围绕国家社会科学基金资助项目“我国数字图书馆集成融汇方法研究”和中国科学院国家科学图书馆青年人才领域前沿项目“利用LOD实现数字图书馆中数字资源与知识内容关联揭示的技术方法研究”对关联参考服务、对象共指问题、关联数据应用的体系框架、关联数
7、据资源集相似度计算方法、Web数据关联创建、信息检索服务和注释服务等进行了研究。从图中还可以看出,作者合著网络图谱整体联系稀疏,网络中大多数节点之间没有连线,关联程度非常小,表明目前关联数据领域还没有形成一支成熟的研究队伍。3.2网络密度分析网络密度可以用来度量网络成员之间联系的紧密程度。一般来说,密度高的网络信息沟通性较强;而密度低的网络常信息不畅[4]。利用Ucinet软件得到高频作者合著网络密度(见图2)为0.0097,这是一个相对偏低的密度值,网络连通性不好,这也印证了在
此文档下载收益归作者所有