基于引文耦合分析方法的相关词识别-论文.pdf

基于引文耦合分析方法的相关词识别-论文.pdf

ID:53759497

大小:410.62 KB

页数:5页

时间:2020-04-24

基于引文耦合分析方法的相关词识别-论文.pdf_第1页
基于引文耦合分析方法的相关词识别-论文.pdf_第2页
基于引文耦合分析方法的相关词识别-论文.pdf_第3页
基于引文耦合分析方法的相关词识别-论文.pdf_第4页
基于引文耦合分析方法的相关词识别-论文.pdf_第5页
资源描述:

《基于引文耦合分析方法的相关词识别-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第33卷第7期情报杂志V01.33No.72014年7月JOURNALOFINTELLIGENCEJuly2014基于引文藕合分析方法硇相关imiR~U殷希红乔晓东张运良(中国科学技术信息研究所北京100038)摘要借鉴引文耦合分析方法,将词条定义中的实词比作词条的参考文献,根据词条定义中实词耦合强度实现相关词的识别。首先对词条定义进行分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,以词条定义中实词的耦合强度作为判定标准实现相关词的推荐,并用人工校对的方法,计算相关词识别的准确率、召回率和F值,论证该方法的有效性。该实验将新能源汽车领域汉语科技词系统中

2、随机选择的500条词条及其定义作为测试集,发现该方法可以达到较高的准确率和召回率。关键词词条定义引文耦合分析实词耦合耦合强度可视化中图分类号TP391文献标识码A文章编号1002—1965(2014】07—0161—04DoI10.3969/j.issn.1002—1965.2014.07.029RelevanceTermsRecognitionBasedOilBibliographicCouplingAnalysisMethodYinXihongQiaoXiaodongZhangYunliang(InstituteofScientificandTechnicalIn

3、formationofChina,Bering100038)AbstractEnlightenedbycitationcouplinganalysismethod,regardingthecontentwordsinthedefinitionoftermastheterm’Srefer-ences,accordingtOthecontentwordscouplingstrengthoftheterm’sdefinition,therelevancetermsrecognitionisachieved.First,theChinesewordsegmentation,p

4、art—of—speechtaggingandmanualcorrectionoftermdefinitionareprocessed.Then,verbsandnounscon—tentwordsareextractedandcontentwordscoupfingstrengthisregardedasthecriteriontoachievetherelevancetermsrecognition.Atlast,manualcorrectionisusedtocalculatetheprecisionandrecallofrelevancetermsrecogn

5、itiontOdemonstratetheeffectivenessofthismeth—od.ThisexperimentregardstheChinesescientificandtechnicalvocabularysystem’S500randomlyselectedtermsandtheirdefinitionsasthetestset(inthefieldofnewenergyvehicles)andfindthatthemethodCanachieveahighprecisionandrecal1.Keywordstermdefinitionbiblio

6、graphiccouplinganalysiscontentwordscouplingcouplingstrengthvisualization式,达到扩检和缩检的效果⋯,因此相关词对于信息检0引言索至关重要。信息用户在利用自然语言进行信息检索时往往忽1963年,Kessler率先提出了引文耦合概念,两略掉所使用语言的相关词,因此减小了检索范围造成篇文献之间拥有的共同引文数量值称为引文耦合强信息漏检或者误检,影响查全率。利用扩展式查询或度。对于强引文耦合关系与主题相关性问题,Vladutz者相关词提示可以解决这个问题。应用查询式扩展或和Cook利用SCI进行了大规模实

7、验,最终得出的结相关词提示可以辅助用户正确表述信息需求,降低信论是:在大规模引文数据库基础上利用引文耦合分析息用户智力负担。此外,在用户查询式的基础上提供是可行的,引文耦合分析(BibliographicCoupling)结相关词,通过检索式的重新构建可以进一步完善检索果是主题相关的。因此本文尝试将引文耦合分析方法收稿日期:2014-02—20修回日期:2014-03—18基金项目:国家自然科学基金项目“面向特定情报分析应用的知识组织系统快速构建关键问题研究”(编号~71203208);国家“十二五”科技支撑计划课题“面向外文科技文献信患的超级科技词

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。