基于检准率分析中文自动标引方式存在问题及对策

基于检准率分析中文自动标引方式存在问题及对策

ID:34032397

大小:3.28 MB

页数:44页

时间:2019-03-03

基于检准率分析中文自动标引方式存在问题及对策_第1页
基于检准率分析中文自动标引方式存在问题及对策_第2页
基于检准率分析中文自动标引方式存在问题及对策_第3页
基于检准率分析中文自动标引方式存在问题及对策_第4页
基于检准率分析中文自动标引方式存在问题及对策_第5页
资源描述:

《基于检准率分析中文自动标引方式存在问题及对策》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河北大学硕士学位论文基于检准率分析中文自动标引方式存在问题及对策姓名:崔涛申请学位级别:硕士专业:图书馆学指导教师:顾潇华2011-05摘要摘要自动标引一直以来都是计算机科学、语言学、图书馆学情报学共同研究的热点问题。随着社会信息化进程的加快,信息资源无论是从发展的规模上,还是覆盖的领域上都得到了极大的发展。但是,由于信息资源数量大、范围广、动态性强,再加上自动标引智能化水平较低,使得信息检准率不高。我国自上世纪八十年代初就开展了对中文自动标引的研究,并在研究期间取得了一定的成果和进展。中文自动标引方式主要包括:单汉字标引、自动抽词、自动赋词、自动分类、N-G

2、ram法、后控制词等方式。从检准率的角度来对中文自动标引方式的标引效果进行分析研究,从而使中文自动标引方式有所改进,并在检索系统中能够被合理有效地利用。本文从检准率的角度,利用文献调查法、计数数据分析法、电话访谈法等对各种中文标引方式的进行了考察。其次,从检索数据库的选择,研究过程描述,数据列表、分析结论等几个研究工作环节,展开了详细的研究。最后,根据检准率的调查数据,分析中文自动标引各种标引方式存在问题,并提出了改进该标引方式的对策和建议。关键词中文自动标引方式检索系统检准率IAbstractAbstractAutomaticindexingisalways

3、thecommonresearchhotspotincomputerscience,linguistics,LibraryandInformationScience.Alongwiththespeedingofsocialinformationprogress,informationresourceacquiresenormousdevelopmentonscaleandthefieldscovered.However,becausetheinformationresourceislargequantity,widerangeandhighdynamic,an

4、dplustheintelligentlevelofautomaticindexingislow,precisioninspectionofinformationisnothigh.OurcountrybegantoresearchChineseautomaticindexingandmadesomeachievementsandprogressessincethebeginningofthe1980s.Chineseautomaticindexingmethodsinclude:singleChinesecharacterindexing,wordextra

5、ction,automaticallyassignedwords,automaticclassification,N-Grammethod,afterthecontrolword,etc.Fromthepointofviewprecisioninspection,thispaperanalyzedandresearchedtheeffectofChineseautomaticindexingandmadesomeimprovetotheChineseautomaticindexingtobeusedreasonablyandeffectivelyinretri

6、evalsystem.ThispaperinvestigatedvariouskindsofmethodsofChineseindexingapplyingliteratureinvestigating,dataanalyticmethodandtelephoneinterviewingmethodformthepointviewofprecisioninspection.ThenitanalyzedindetailedfromselectionofSearchDatabases,descriptionofresearchprocess,datalistand

7、analysisofconclusion.ThispaperanalyzedtheproblemofvariouskindsindexingmethodsofChineseindexingandputforwardthecountermeasureandadviceforimproving.KeywordsChineseautomaticindexingRetrievalsystemPrecisioninspectionII第1章绪论第1章绪论随着互联网技术的迅速发展和广泛应用使得社会信息化进程不断加快,信息资源的载体呈现出多种多样的形式,尤其是网络信息环境下

8、的信息资源。不同的互联网机构,网站对于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。