基于文献计量的我国搜索引擎研究现状和热点分析

基于文献计量的我国搜索引擎研究现状和热点分析

ID:11753244

大小:26.00 KB

页数:13页

时间:2018-07-13

基于文献计量的我国搜索引擎研究现状和热点分析_第1页
基于文献计量的我国搜索引擎研究现状和热点分析_第2页
基于文献计量的我国搜索引擎研究现状和热点分析_第3页
基于文献计量的我国搜索引擎研究现状和热点分析_第4页
基于文献计量的我国搜索引擎研究现状和热点分析_第5页
资源描述:

《基于文献计量的我国搜索引擎研究现状和热点分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于文献计量的我国搜索引擎研究现状和热点分析  摘要:运用文献计量的方法对我国搜索引擎领域的相关文献进行多角度的定量和定性分析,明晰搜索引擎研究领域的主要研究机构、核心作者和核心期刊,并通过论文关链词和主题分析,发现目前的研究热点主要集中于4个方面:(1)搜索引擎的基本原理和关键技术;(2)元、垂直、个性和智能等4种搜索引擎研究;(3)搜索引擎的应用及商业盈利;(4)搜索引擎相关的知识产权等法律问题4个方面。  关键词:搜索引擎;文献计量;研究现状;热点    近年来,由于网络和信息技术的快速发

2、展,互联网上的信息成爆炸式的增长,网络成为了人们发布和获取信息的重要渠道,然而网络信息过于分散和无序的分布使得用户获取信息遇到很大困难。在这种背景下,搜索引擎提供的信息服务方式也越来越重要。搜索引擎是一种用于帮助因特网用户在互联网上查询信息的搜索工具,它以一定的策略在因特网中发现、搜集信息,并对搜集的信息进行加工整理和组织存贮,为用户提供检索服务,从而起到信息导航的作用。搜索引擎产生于20世纪90年代。产生的时间虽不长,但已经在学术界、商业界以及人们的日常生活中发挥了巨大的作用,根据中国互联网信

3、息中心2010年7月发布的《中国互联网络发展状况统计报告》第26次调查统计报告显示搜索引擎用户规模已达3.2亿人在各类网络应用使用率中的排名位居第三,这使得网络搜索引擎的研究成为当前国内外研究的热点。为了解我国近年来在该领域的研究现状、热点以及分析其发展趋势,笔者拟用文献计量的方法对我国搜索引擎领域的相关文献进行以定量分析。希冀得出一些有益的结论,为该领域的研究提供借鉴。hg0088http://www.hg0088.cdJ543  1、数据来源和研究思路  1.1数据来源  采用清华同方的中国

4、知识资源总库(CNKI)中的数据库之一“中国学术期刊网出版总库”作为数据来源,文献发表时间截止到2011年底,检索时间为2012年1月,以“题名”为检索途径,以“搜索引擎”为检索词进行检索,得到检索结果为3814条数据。除去20条为各类研讨会征稿通知,剩余3794条为和搜索引擎相关的文献数据。  1.2研究思路  本文首先采用文献计量方法对相关文献的数量、著者分布、期刊分布、主要研究机构进行分析以揭示研究现状,然后对数据进行抽样,选取发表时间为近五年即2007-2011年的核心期刊论文,对其所研

5、究的主题内容进行分析从而揭示出该领域的研究热点及发展趋势。主要利用CNKI自带的检索结果分组和Excel进行数据统计。  2、文献调研与分析结果  2.1文献信息量统计  发表文献的数量在一定程度上代表了某个领域的研究水平与发展趋势。图1所示的是1996-2011年16年间的文献量,其中2011年的数据可能还有部分文献没有上传到网上,估计全部数据应比2010年数据相差不多。从图中可以看出从1996-2004年是搜索引擎相关的论文的迅猛增期,在这个数据库中从1996年才出现的搜索引擎相关文献,到2

6、004.年已经迅猛发展到300多篇,此后发文量进入稳步发展期,从2007年有一个发展高峰,2008-2009年达到顶峰,从2010年略有下降。应该是进入又一稳定发展时期。考查文献内容可知,搜索引擎的发展已经从诞生、迅猛发展、平稳发展,进入专门化深入化研究。这也表明对搜索引擎这一领域研究的逐步成熟。据此可以预见在未来一段时间内,搜索引擎研究仍将是我国学者关注的热点之一。  2.2论文著者统计分析  对于作者发文量的统计分析可以识别某研究领域的高产作者。本文选取发文量5篇以上的作者作为高产作者,共3

7、1人,共发文211篇如表1所示。  对高产作者发文量的统计中发现很多作者是合著者,我们知道第一作者是论文的主要责任人和撰写人,选取以第一作者身份发表论文的作者统计如表2所示。  对论文被引频次的统计可反映其及学术影响力。截止检索日被引次数前十的高被引作者如表3所示。  被引频次排在第一的是来自华东理工大学的陈树年教授,他是我国著名情报检索语言专家,长期从事检索语言的研究、教学和实践工作,在分类法、主题法以及网络信息组织研究领域有较高的造诣。从表2和表3我们也可以看出高产作者和高被引作者基本不一致

8、,这说明虽然近年来对搜索引擎的研究比较热门投入到这一领域的专家也非常多,但专注于此的人并不多。高产并且高影响力的专家还显缺乏。其中只有张卫丰教授是既高产又高被引的作者,他主要从事Web应用技术、模式分类、搜索引擎技术、人工智能、机器学习、数据挖掘以及信息获取等方面的研究,是年轻一代的专家。  2.3高产机构分析  发表论文在20篇以上的高产机构如表4所示:  从论文数量上看,武汉大学以80篇的数量排在第一位。排在第二的是北京大学,其他排名比较靠前的还有中山大学、清华大学、南京大学等。该领域的高产

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。