欢迎来到天天文库
浏览记录
ID:8369540
大小:152.50 KB
页数:7页
时间:2018-03-23
《3问句成分与rdf三元组的对应关系 - 中国科学院国家科学图书馆》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、中文问句与RDF三元组映射方法研究*本文受“十一五”科技支撑计划课题“网络科技信息监测与评价”(2006BAH03B05)资助。许德山1,2张智雄1赵妍3(1中国科学院国家科学图书馆,北京100190)(2中国科学院研究生院,北京100049)(3郑州航空工业管理学院计算机科学与应用系,郑州450015)[摘要]主要探索中文问句与RDF三元组的转换方法。文章首先对中文问句的特点进行了分析,然后结合RDF(S)模型的优势,探索了RDF三元组与问句语义的对应关系,进而提出了直接映射和间接映射两种映射方式。该方法只需做浅层的句法分析,将获取的限定
2、成分映射为三元组内部的语义标签,从而降低了句法分析和三元组组配的难度。最后分析了映射方法中存在的问题并提出未来工作的重点。[关键词]问题分类;RDF模型映射;三元组映射[分类号]TP391AResearchonChineseInterrogativeSentencesandRDFTriplesMappingMethodsDeshanXu1,2ZhixiongZhang1YanZhao3(1TheNationalScienceLibrary,ChineseAcademyofSciences,Beijing100190)(2GraduateUn
3、iversityofChineseAcademyofSciences,Beijing100049)(3DepartmentofcomputerScienceandApplication,ZhenzhouCollegeofAeronauticalIndustryManagement,Zhengzhou450015)[Abstract]ThispaperintroducestwomappingmethodsbetweenChineseinterrogativesentencesandRDFtriples.Wefirstlyanalyzethec
4、haracteristicsoftheChinesequestionsanddiscusstherelationshipbetweentheRDFtriplesandthequestionsaccordingtotheadvantagesofRDF(S)model.Furthermore,weproposedtwomappingmethods-directandindirect.Onlyshallowparsingneedstobedoneduringprocessing,andthentherestrictivechunksaremapp
5、edintosemanticlabelsinsidetriple,sothemethodsmakethesyntacticparsingandthetriplesassemblingeaser.Finally,weanalyzetheopenissueinthemethodsandshowourexpectationinthefuture.[Keyword]QuestionClassification;RDFModelMapping;TripleMapping引言国际万维网联盟(W3C)也推出了面向语义检索的标准查询语言SPARQL,用来完
6、成对RDF本体的各种检索。但SPARQL的使用并不简单,需要了解本体知识库的组织方式,并学会用SPARQL的语法来表达自己的查询意图,这就为普通用户带来了不便。为此本文试图探索一种映射方法:用户只需用自然语言来表达自己的查询意图,系统自动-7-完成问题到SPARQL的转换和概念推理,然后返回查询结果。1中文问句的特征分析本文的研究主要针对由关键成分(主、谓、宾等)和修饰成分(定、状、补等)构成的标准问句进行分析,这类问句结构完整,意思表达明确,容易进行形式化处理。具体来看主要存在下列特征。①句子短小,主旨明确。通常根据问句的疑问特点将其分为
7、是非问句,选择问句,特指问句[1]。其中特指问句使用的比例最大,也最有实际意义。特指问句的特点是对特定的疑问对象进行发问,以获取与此对象相关的信息,涉及的答案往往是与人、地点、时间、数量、事情、机构等命名实体有关的事实、列举、定义等问题。②具有特定的疑问词。疑问词对所问内容的类型及其范围具有很强的限定作用。如“哪儿”、“哪里”、“何处”等往往询问地点或方位,“谁”、“何人”、“哪个人”等询问特定的某个人。另外有一些特定的疑问词,具有很强的构词能力,通过与其它的名词结合能够构成疑问短语,可以对特定的内容进行提问,如“什么”、“哪”、“何”等。
8、2问句成分提取策略问句的分析与映射是语义检索系统工作流程中一个重要的环节,通常需要完成以下几部分工作:问句分词和词性标注、确定问题的类型、确定问题的焦点、确定答案的类型、关键成分
此文档下载收益归作者所有