doi和论文数据库抽取在文献元数据获取方面的应用

doi和论文数据库抽取在文献元数据获取方面的应用

ID:31985269

大小:935.30 KB

页数:7页

时间:2019-01-30

doi和论文数据库抽取在文献元数据获取方面的应用_第1页
doi和论文数据库抽取在文献元数据获取方面的应用_第2页
doi和论文数据库抽取在文献元数据获取方面的应用_第3页
doi和论文数据库抽取在文献元数据获取方面的应用_第4页
doi和论文数据库抽取在文献元数据获取方面的应用_第5页
资源描述:

《doi和论文数据库抽取在文献元数据获取方面的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/272831111ApplyingtoLiteratureMetadataAcquisitionUsingDOIandExtractionofPaperDatabaseArticle·December2012CITATIONREADS1411author:KunMaUniversityofJinan(Jinan,Ch

2、ina)91PUBLICATIONS177CITATIONSSEEPROFILEAllcontentfollowingthispagewasuploadedbyKunMaon28February2015.Theuserhasrequestedenhancementofthedownloadedfile.2012年12月现代情报Dec,2012第32卷第12期JournalofModernInformationVol32No12信息资源开发与利用DOI和论文数据库抽取在文献元数据获取方面的应用马坤(济

3、南大学山东省网络环境智能计算技术重点实验室,山东济南250022)摘要为了提高文献录入效率和准确率,减少录入文献的人工审核,提出一种基于DOI和论文数据库的在线文献元数据获取方法,设计DOI解析代理集成异构的DOI注册代理机构的服务接口,通过RoadRunner算法实现基于论文数据库详情页的文献元数据抽取。最后实现在线文献元数据智能录入系统,验证上述方法的有效性和实用性。关键词数字对象标识符;论文数据库;Web信息抽取;网页聚类DOI:10.3969/j.issn.1008-0821.2012.12.0

4、11中图分类号TP393文献标识码B文章编号1008-0821(2012)12-0044-06ApplyingtoLiteratureMetadataAcquisitionUsingDOIandExtractionofPaperDatabaseMaKun(ShandongProvincialKeyLaboratoryofNetworkBasedIntelligentComputing,UniversityofJinan,Jinan250022,China)AbstractAimingatimp

5、rovingtheefficiencyandaccuracyoftheinputofliterature,andreducingthereviewprocessoftheliterature,thispaperintroducedanacquisitionapproachofonlineliteraturemetadatabasedonDOIandpaperdatabase,andde-signedDOIparserproxytointegratetheserviceinterfaceofheterogeneou

6、sDOIregistrationagency,andimplementedtheliteraturemetadataextractionofpaperdatabaseusingRoadRunneralgorithm.Finallytheonlineliteraturemetadataintelligentinputsystemwasimplementedtoverifythefeasibilityandcorrectnessofourapproachinpractice.Keywordsdigitalobje

7、ctidentifier;paperdatabase;Webinformationextraction;pageclustering[1]为了改善文献录入方式,自动验证录入文献归属,本码、摘要等)。该方法一般需要手工从论文数据库将文献文结合DOI与论文数据库,提出了一种新颖的在线文献元题录导出,然后再进行导入。目前部分文献管理工具已经数据智能获取方法。实现文献题录的直接导入,自动检测论文数据库题录格式(EndNoteCitationFile、ResearchInformationSystemsCitation

8、File1相关工作和BibTex等),无需人工参与。但是,该方法需要论文数据目前,国内外在线文献管理系统中文献获取与录入方库出版系统提供规范置标的题录可读输出以及相应的API,法主要有文献题录直接导入、基于DOI的文献题录导入、不同出版系统API又具有异构性,缺乏一个可以共同遵循基于论文数据库网页的题录抓取和论文文件题录抓取等方的标准。[1]式。12基于DOI的文献

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。