欢迎来到天天文库
浏览记录
ID:35065800
大小:4.08 MB
页数:57页
时间:2019-03-17
《基于文物素材知识库的自动录入方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基基基于于于文文文物物物素素素材材材知知知识识识库库库的的的自自自动动动录录录入入入方方方法法法研研研究究究AStudyonAutomaticImportMethodbasedCulturalMaterialDatabase工程领域:计算机技术作者姓名:刘阳指导教师:王秀锦副教授企业导师:杨波高级工程师天津大学计算机科学与技术学院二零一五年十二月摘要文物素材信息作为文化创意产业的核心内容,是围绕中华民族本土文化进行工业设计、创意设计的灵感来源,对文物素材信息进行提取、存储与管理具有非常重要的意义以及应用价值。但是限于中华五千
2、年的悠久历史所导致的文物种类繁多、寓意繁杂以及汉语言本身复杂等问题,在实际的素材入库过程中,却存在着由于文物关键信息的缺失以及工作人员对文物信息无法解读所导致的无法入库、入库难等现象。因此,针对文物素材信息的特点,结合中文自然语言处理、数据库检索等相关技术设计出一套辅助录入的解决方案,同时实现基于文物素材数据库的自动录入工具非常有必要。本文针对上述问题主要做了如下工作:首先简要介绍了文物素材库建设背景和意义,并分析了对文物知识解读的现状,总结了中文分词技术、数据库关键词检索技术以及中文短文本分类技术的已有研究成果。重点介绍了
3、基于词典的中文分词方法,针对文物领域文言句式普遍、信息量少等特点,提出了建立文物领域专用词典的方法,通过引入文物领域专用词典,分词的结果较往前有了很大的提高。其次针对文物素材关键信息缺失导致素材无法入库的问题,提出了基于文物素材数据库本身作为参考的录入方法,通过使用文物素材关键词字段信息配合基于关系数据库的关键词检索方法,最大程度上地利用了文物素材库中的已有信息。最后通过中文短文本分类的方法,对文物素材文本信息进行按属性归类导入,解决了因工作人员对文物解读困难导致的入库难的问题。基于以上内容实现了一款基于文物素材数据库的自动
4、录入工具,界面简洁美观、操作方便,支持对文物素材数据库的内部检索以及对外部文本的按需导入。最大程度上减少了文物素材数据库的建设周期,提高了工作人员的录入效率。关关关键键键词词词:::文物素材,中文分词,关键词检索,短文本分类ABSTRACTAsthecoreofculturalandcreativeindustries,culturalmaterialinformationisthekeyinspirationaroundtheChinesenativecultureofindustrialdesignandcreative
5、design,sothematerialinformationextraction,analysisandstoragehasaveryimportantmeaningandvalue.However,thefivethousandyearsofhistoryofChinamadeitverydifficultbecauseofthecomplexityofChineselanguageandthehugenumberofkindsofculturalrelics.Intheactualculturalmaterialstorag
6、eprocess,it’sverylikelyfailedbecauseofthelackofstaffandkeyinformation.Therefore,it’sextremelynecessarytodesignaauxiliaryinputsolutionbasedonChinesenaturallanguageprocessing,databaseretrievalandotherrelatedtechniques,alongwithdevelopingaautomatictool.Thispapermainlyc
7、ontributeonthefollowing:First,wegaveabriefintroductiononthebackgroundandmeaningofculturalmate-rialdatabaseandanalysedthecurrentsituationofculturalknowledgeinterpretation.WealsosummarizedtheexistingresearchresultsonChinesewordsegmentation,databaseretrievalandChinese
8、shorttextclassification.ThemaincontentistointroducetheChi-nesedictionary-basedwordsegmentationmethod,andproposedamethodtobuilddomain-specificcultur
此文档下载收益归作者所有