基于共链分析的高校图书馆网络结构研究

基于共链分析的高校图书馆网络结构研究

ID:20720543

大小:53.00 KB

页数:14页

时间:2018-10-15

基于共链分析的高校图书馆网络结构研究_第1页
基于共链分析的高校图书馆网络结构研究_第2页
基于共链分析的高校图书馆网络结构研究_第3页
基于共链分析的高校图书馆网络结构研究_第4页
基于共链分析的高校图书馆网络结构研究_第5页
资源描述:

《基于共链分析的高校图书馆网络结构研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于共链分析的高校图书馆网络结构研究[摘要]选取全球30个高校的图书馆网站,通过Yahoo!搜集其共链数据,并利用聚类分析、多维尺度分析和网络可视化分析法描述和解释高校图书馆的网络结构及其成因,揭示各馆的网络角色,明晰当代全球高校图书馆网络群体的群落划分及其相互关系,并为我国的高校图书馆建设事业提出建议。[关键词]共链分析高校图书馆网络结构[分类号]G250.71.引言网络共链分析的思想来源于文献共引分析。共链,就是指两个网站同时被其他网站链接。一般认为同时被其他网站链人的网站,在主题上或多或少都具

2、有一定的相似性或相关性,利用网站共被链入的次数(共链频次),可以测度网站内容的相关度或相似度。共链频次越高,相关度越大。网络结构就是指网站之间实际存在或者潜在的关系模式。网络共链分析提供的是分析对象之间由链接关系形成的相互关系的亲疏程度,通过一组网站之间的共链关系可以形成共链网络,网络节点之间的远近可以反映它们的亲疏关系,进而揭示网站间的关系模式(如:整体网络结构模式、内部子结构和节点的网络位置与角色等),并利用聚类分析、多维尺度分析等统计分析方法,将这种群落关系表示出来,以实现网络结构可视化及网络

3、群体间相互关系的挖掘。MikeThelwIal等利用共链和鍋合理论进行了网络中相似学术网站的发现与识别研究。该方法在获取隐性网络信息资源和反映知识结构方面非常有效。鉴于此,本文利用共链分析方法,描述和解释了全球30所高校图书馆网站间的亲疏关系与网络结构及其成因,在此基础上为我国的高校图书馆建设事业提出建议。1.研究设计2.1研究对象的选择本研究以大学图书馆网站为研宄对象,以代表性和先进性作为样本的选取原则。根据《美国新闻及世界报道》(USNEWS)公布的2010年世界大学排行榜,从排名在前60位的大

4、学中选取了分布在全球不同国家/地区的30个大学的图书馆网站作为研究对象。各大学的排名、名称、简称、所属国家/地区以及图书馆网址见表1。2.2数据收集工具的选择和使用对于网络链接分析的许多研究主要以搜索引擎AltaVista和AIITheWeb作为数据收集工具。Google由于不能进行外部链接的收集而未被广泛应用。2004年3月,Yahool收购了AltaVista和AIITheWeb。因此,本文选用Yahoo!作为数据收集的工具。所用检索式如表2所示(以清华大学和哈佛大学图书馆网站为例):由于很多网

5、站除了使用标准的“WWW.省略”这样域名形式以外,还可能会使用如“mail.省略”形式的域名。为有效防止上述情况带来的数据噪声,以更精确地获得该网站的外部反向链接,在查询语句的“site”部分,我们只使用了一部分域名,而不包括“WWW”部分对于30所大学图书馆网址的获取,首先通过Google搜索各个大学图书馆的网址,进入该大学图书馆主页,在对其网站内容与结构进行全面考察核实后,再最后确定其网址。考虑到搜索引擎的数据更新,为了数据的一致性,我们在2010年10月12日至10月13日集中采集了数据。1.

6、数据处理3.1数据预处理收集到的原始共链数据形成了一个对称矩阵,其中第x行、第y列的数据代表网站x和网站y的共链频次。为了突出网站自己与自己的亲密关系,对角线上的值应是该网站与其他网站共链频次中最高的,此处采用“最大值+1”。虽然这个原始矩阵可以直接输入分析程序中绘制关系图,但是原始共链频次并不能准确地度量两所高校图书馆网站的关联强度。因此,本文利用jaccard索引法对原始共链矩阵进行规范化处理。规范化公式为:Nxy=Cxy/(Cxy+Cyy-Cxy)其中,Cxx与Cyy分别指x与y大学图书馆网站

7、的反向链接数;Cxy指同时链接x大学图书馆网站和y大学图书馆网站的网页的集合,即原始共链频次。为了衡量各高校图书馆网站间的相似性大小,在进行聚类分析和多维尺度分析之前,先利用SPSS将规范后的共链矩阵转换为相关矩阵。然后对此相关矩阵进行处理,以挖掘各高校图书馆网络隐性结构与交流模式。3.2聚类分析将相关矩阵输入到聚类分析程序中进行处理,并绘制出聚类龙骨图(见图1)。3.3多维尺度分析多维尺度分析可以通过适当的降维,利用平面距离来反映变量之间的相似或者不相似程度,通过低维空间来展现各高校图书馆之间的联

8、系。将相关矩阵输入到多维尺度分析程序中进行处理,并绘制出多维尺度图(见图2)。应用SPSS软件进行多维尺度分析时,会给出Stress和RSCU直,它们分别表示信度和效果估计值。一般来说,Stress0.8时,结果是可信有效的,并且Stress值越小越好,RSQ值越大越好。在本文的共链分析中,Stress=0.082890.8,说明该分析过程是有效的、可信的。根据聚类龙骨图以及多维尺度分析图,我们将30个高校图书馆网站分为6类,并在图中用虚线和字母加以标识。3.4共链分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。