中文问句和rdf三元组映射方法研究

中文问句和rdf三元组映射方法研究

ID:18997745

大小:152.50 KB

页数:7页

时间:2018-09-27

中文问句和rdf三元组映射方法研究_第1页
中文问句和rdf三元组映射方法研究_第2页
中文问句和rdf三元组映射方法研究_第3页
中文问句和rdf三元组映射方法研究_第4页
中文问句和rdf三元组映射方法研究_第5页
资源描述:

《中文问句和rdf三元组映射方法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中文问句与RDF三元组映射方法研究*本文受“十一五”科技支撑计划课题“网络科技信息监测与评价”(2006BAH03B05)资助。许德山1,2张智雄1赵妍3(1中国科学院国家科学图书馆,北京100190)(2中国科学院研究生院,北京100049)(3郑州航空工业管理学院计算机科学与应用系,郑州450015)[摘要]主要探索中文问句与RDF三元组的转换方法。文章首先对中文问句的特点进行了分析,然后结合RDF(S)模型的优势,探索了RDF三元组与问句语义的对应关系,进而提出了直接映射和间接映射两种映射方式。该方法只需做浅层的句法分析,将获取的限定成分映射为三元组内

2、部的语义标签,从而降低了句法分析和三元组组配的难度。最后分析了映射方法中存在的问题并提出未来工作的重点。[关键词]问题分类;RDF模型映射;三元组映射[分类号]TP391AResearchonChineseInterrogativeSentencesandRDFTriplesMappingMethodsDeshanXu1,2ZhixiongZhang1YanZhao3(1TheNationalScienceLibrary,ChineseAcademyofSciences,Beijing100190)(2GraduateUniversityofChineseA

3、cademyofSciences,Beijing100049)(3DepartmentofcomputerScienceandApplication,ZhenzhouCollegeofAeronauticalIndustryManagement,Zhengzhou450015)[Abstract]ThispaperintroducestwomappingmethodsbetweenChineseinterrogativesentencesandRDFtriples.WefirstlyanalyzethecharacteristicsoftheChineseq

4、uestionsanddiscusstherelationshipbetweentheRDFtriplesandthequestionsaccordingtotheadvantagesofRDF(S)model.Furthermore,weproposedtwomappingmethods-directandindirect.Onlyshallowparsingneedstobedoneduringprocessing,andthentherestrictivechunksaremappedintosemanticlabelsinsidetriple,sot

5、hemethodsmakethesyntacticparsingandthetriplesassemblingeaser.Finally,weanalyzetheopenissueinthemethodsandshowourexpectationinthefuture.[Keyword]QuestionClassification;RDFModelMapping;TripleMapping引言国际万维网联盟(W3C)也推出了面向语义检索的标准查询语言SPARQL,用来完成对RDF本体的各种检索。但SPARQL的使用并不简单,需要了解本体知识库的组织方式,并学

6、会用SPARQL的语法来表达自己的查询意图,这就为普通用户带来了不便。为此本文试图探索一种映射方法:用户只需用自然语言来表达自己的查询意图,系统自动-7-完成问题到SPARQL的转换和概念推理,然后返回查询结果。1中文问句的特征分析本文的研究主要针对由关键成分(主、谓、宾等)和修饰成分(定、状、补等)构成的标准问句进行分析,这类问句结构完整,意思表达明确,容易进行形式化处理。具体来看主要存在下列特征。①句子短小,主旨明确。通常根据问句的疑问特点将其分为是非问句,选择问句,特指问句[1]。其中特指问句使用的比例最大,也最有实际意义。特指问句的特点是对特定的疑问

7、对象进行发问,以获取与此对象相关的信息,涉及的答案往往是与人、地点、时间、数量、事情、机构等命名实体有关的事实、列举、定义等问题。②具有特定的疑问词。疑问词对所问内容的类型及其范围具有很强的限定作用。如“哪儿”、“哪里”、“何处”等往往询问地点或方位,“谁”、“何人”、“哪个人”等询问特定的某个人。另外有一些特定的疑问词,具有很强的构词能力,通过与其它的名词结合能够构成疑问短语,可以对特定的内容进行提问,如“什么”、“哪”、“何”等。2问句成分提取策略问句的分析与映射是语义检索系统工作流程中一个重要的环节,通常需要完成以下几部分工作:问句分词和词性标注、确定

8、问题的类型、确定问题的焦点、确定答案的类型、关键成分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。