_情报学报_1999-2008年国内文本分类研究文献计量分析

_情报学报_1999-2008年国内文本分类研究文献计量分析

ID:40879472

大小:232.00 KB

页数:10页

时间:2019-08-09

_情报学报_1999-2008年国内文本分类研究文献计量分析_第1页
_情报学报_1999-2008年国内文本分类研究文献计量分析_第2页
_情报学报_1999-2008年国内文本分类研究文献计量分析_第3页
_情报学报_1999-2008年国内文本分类研究文献计量分析_第4页
_情报学报_1999-2008年国内文本分类研究文献计量分析_第5页
资源描述:

《_情报学报_1999-2008年国内文本分类研究文献计量分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、1999-2008年国内文本分类研究文献计量分析*基金项目:国家社科基金项目“自动文本分类技术研究”(编号:08CTQ003)资助,广东省哲学社会科学基金项目“开源软件与数字图书馆建设探讨”资助(编号:06M03)。作者简介:肖可,男,1980年生,硕士研究生,主要研究领域:信息检索。奉国和,男,1971年生,博士,副教授,主要研究领域:数据挖掘、数字图书馆,发表论文30多篇。肖可奉国和(华南师范大学经济与管理学院信息管理系,广州510006)摘要文本分类作为处理和组织大量文本数据的关键技术,在信息过滤、信息检索、搜索引擎、数字图书馆等领域有着广泛的应用前景。基于文献计量法

2、对1999-2008年间文本分类相关研究论文作了统计分析,按基础理论研究和应用研究两部分分别进行了深入的探讨,前者涉及了文本分类过程中的各种关键技术:文本预处理、文本表示、特征降维、分类算法、效果评估,后者则包括文本分类在各领域的应用研究和文本分类系统的设计与开发。文章深入地揭示了文本分类研究内容、发展历程、研究热点和理论成果,并对未来的研究趋势进行了预测。关键词文本分类自动分类文献计量统计分析AStatisticalAnalysisofPapersonTextCategorizationfrom1999to2008inChinaXiaoKeFengGuohe(School

3、ofEconomics&Management,SouthChinaNormalUniversity,Guangzhou510006)AbstractBeingthekeytechnologytoprocessandorganizesubstantialdata,textclassificationissignificantininformationfiltering,informationretrieval,searchengine,digitallibraryandotherareas.Thisarticleanalyzesthepapersoftextcategoriz

4、ationthosepublishedfrom1999to2008basedonquantitativemethod,andanalyzesfundamentalresearchandappliedresearch,theformerincludesthetechnologiesintextclassification:textpreprocessing,textrepresentation,featurereduction,classificationalgorithm,effectevaluation,thelaterincludestheappliedresearch

5、oftextclassificationinvariousfieldsandthedesignanddevelopmentoftextclassificationsystems.Thearticlerevealsthecontentsoftextclassification,thedevelopmentprocess,researchhotspots,theoreticalachievementsandpredictsthefuturetrends.Keywordstextcategorizationautomaticcategorizationbibliometricss

6、tatisticalanalysis文本分类结合信息处理技术、机器学习和统计学习理论,在文本识别、搜索引擎、信息过滤、电子政务、数字图书馆等方面有着深入的应用,已经成为信息处理现代化的关键。文本分类的研究可以追溯到上世纪六十年代,早期的文本分类主要有词匹配法以及后来兴起的知识工程方法,后者通过手工定义一些规则来对文本进行分类,费时费力。到上世纪九十年代,基于统计的自动文本分类方法日益受到重视,它在准确率和稳定性方面具有明显的优势。到目前为止,国外的文本自动分类研究已经从最初的可行性基础研究经历了实验性研究进入实用的阶段,并在邮件分类、信息过滤等方面取得了较为广泛的应用。国内

7、对文本分类研究比较晚,1981年侯汉清教授首先探讨和介绍了国外文本分类的研究情况。近年来,国内的许多科研单位和高等院校竞相开展文本分类的基础理论及其应用研究,取得了较丰硕的研究成果。笔者利用文献计量法统计了1999-2008年10年间我国文本分类研究领域发表的论文,试图通过回溯分析揭示10年来该领域研究的发展轨迹、研究路线、学术成果及存在的相关问题,并对其发展进行展望。1论文统计分析笔者基于CNKI期刊全文数据库、硕博士学位论文全文数据库、中国重要会议论文全文数据库和中国专利全文数据库分别以“文本分类”、“自动分类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。