谈论引文分析方法的网络化发展和应用

谈论引文分析方法的网络化发展和应用

ID:26233715

大小:54.50 KB

页数:7页

时间:2018-11-25

谈论引文分析方法的网络化发展和应用  _第1页
谈论引文分析方法的网络化发展和应用  _第2页
谈论引文分析方法的网络化发展和应用  _第3页
谈论引文分析方法的网络化发展和应用  _第4页
谈论引文分析方法的网络化发展和应用  _第5页
资源描述:

《谈论引文分析方法的网络化发展和应用 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、谈论引文分析方法的网络化发展和应用  [论文关键词]引文分析网络信息计量网络链接分析  [论文摘要]引文分析是传统文献计量学和科学计量学的一种独特研究方法。主要从网络链接分析研究、基于网页链接分析的搜索引擎排序算法研制和新型网络引文索引工具的编制等方面,分析论述引文分析方法在网络环境下的发展和应用,以期形成对引文分析方法及其价值的合理认知和评价。      1、引言    所谓“引文分析(CitationAnalysis)”,是指利用各种数学和统计学的方法,以及比较、归纳、抽象、概括等逻辑方法,对学术期刊、论文、著者等各种对象的引用与被引用现

2、象进行分析研究,以便揭示其数量分布特征和内在关联规律的一种文献计量研究方法。  追溯引文分析思想的渊源,最初的相关活动都出现在法学领域。特别是1873年美国出版的专供律师查阅法律判例的检索工具——“Shepard’sCitations”,对后来引文分析工具的研制产生了直接而重要的影响。1927年,美国的Gross夫妇对化学专业期刊论文的  其次从网络链接分析领域开展的主要研究工作上观察,“引文分析”的烙印也是清晰可见。目前,网络链接分析的研究进展主要集中在以下几方面”。:网络链接分析与引文分析的理论比较;网络链接目的、类型及其特殊性分析;学术

3、性网站与电子期刊的网络影响因子研究;核心网站的测定;网络链接分析的工具开发;基于网络计量的学术性机构科研能力评价;搜索引擎检索质量的改进①等。从中不难看出,除搜索引擎议题外,其他广受关注的网络链接研究选题与传统的引文分析研究呈现出了较大的相似性。  应该说,传统的引文分析思想为网络环境下链接分析研究工作的开展奠定了必要的学术基础,并发挥了重要的影响力。尤其是把引文聚类分析等方法应用到网站或网页的链接分析中,以此观察Web网页与网站内容之间的关系,对探讨、解决网络空间(cyber-space)的知识结构以及识别相关站点群落等都具有很大的价值。不

4、过,从目前的研究现状来看,由于传统引文分析思想的局限性及网络链接自身的特殊性和复杂性,网络链接分析的深入研究还面临着很多难题。例如,对搜索引擎的过分依赖,缺乏适用的专门工具;由于(动态)网页开发语言不断增多,链接信息的解析与数据获取越来越复杂;指标设计和研究方法不够完善,无法完全满足网络信息计量和链接分析的需要;研究思路不够开阔,选题过分局限于教育、科研等学术性领域,难以应对当前网络发展对社会的全方位影响和渗透局面。    3、基于网页链接分析的搜索排序算法    如果把网络链接分析看作是引文分析思想在网络环境下的一种理论创新和发展,那么,已

5、在搜索引擎中得到广泛使用的各种基于网页链接分析的搜索排序算法的研制,则可以看作是引文分析方法的一种新型网络应用。  由于网络搜索技术的局限性,搜索结果排序算法一直是各类搜索引擎关注的核心问题。受传统引文分析研究思想的影响和启发,目前在搜索结果排序方面已产生了一系列基于网页链接分析的有效而成功的算法,其中尤以搜索引擎Google1998年开发的PageRank算法最具影响力。  传统的搜索结果排序算法主要建立在网页内容与用户搜索请求相关性判断的基础上,这种方法深受网页关键词作弊的危害。作为一种新型的排序算法,PageRank的研制直接受到了传统

6、文献计量学引文分析研究思想的影响和启发,两者具有明显的相似之处。引文分析研究的基本前提假设之一是:一篇文献的学术水平、(或质量)可由它被其他文献引用的次数来评定,被引用的次数越多,则它的学术水平(或质量)就越高。于是,PageRank算法将这种思想推广、应用到了网页链接分析中。PageRank的基本算法思想可以概括为以下三点:①如果一个页面被多次引用(或链接),那么这个页面很可能是重要的;②如果一个页面尽管没有被多次引用,但却被一个重要的页面引用,那么这个页面很可能是重要的;③一个页面的重要性被均分,并传递到它所引用(或链接)的页面。据此,对

7、网络中每个Web页面的链接状况进行全面分析并赋予它们不同的PageRank值(即重要性值),便可以应用于网页搜索的结果排序。  由于这种排序思想主要建立在网页链接分析的基础上,不仅独立于网页的语言和内容,而且不需要人工干预就能自动发现Web上的重要资源,因而提供了一种衡量网页质量的有效方法。  PageRank算法的研制和应用不仅为Coogle赢得了巨大的成功,而且迅速催生了一系列类似的排序算法,例如用于博客搜索结果的PeopleRank算法、在网络自由分类法使用过程中的UserRank算法、TagRank算法和FolkRank算法等。其中,

8、PeopleRank算法主要基于博客用户之间的联系(具体联系方式包括好友链接或朋友列表、博文阅读、回复与评论等)来自动发现重要的博客用户,并依此作为博客搜索结果排序

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。