欢迎来到天天文库
浏览记录
ID:39107177
大小:1.56 MB
页数:41页
时间:2019-06-25
《Ontology驱动的异构数据源上的关键字搜索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、【Abstract】M鹤siveheterogeneousXMLdatasources锄ergeontlleintemetnowadays.Thesedatasourcesareg∞erally挑tonomous锄dprovidesearchinterfac懿ofXMLque科lallguagesuch嬲XPaⅡl0rX(ⅫeryAccordin酉y'userSneedtoleamcomplexsynt弧船锄dk∞wmeschem鹊t0accessm锄.KeywordSe∞chisa1ls静伍髓dlyin
2、fon】舱tiondiscove巧t池ique,wllichcanhelpnovice髑e玛obtaill璐e向liIlf0衄ationconveniently’howev盯mesearcllsem删cstumstobeVague.WbproposeasyStemSOAKwhjchcanpr0啊deacommonkeywordinterf.acef.orheterogell∞usXMLdata∞urc懿.SCh~K锄ploysOWLontology【l8】t0r印reSents铷怕nticsofXMLda
3、t毛forontologyis觚explicitSpecificationofasharedconc印tualization聃帖chCaIlexpressrichs锄锄tics.Conscqu铋tly'SOAKc锄convcysu伍cientsem缸mcalinfonnationmroughit.Therea∞mailllymr∞adV明tagesoftllissyst锄:(1)SOAKc锄diStillsem锄ticalinf0衄鲥on丘.omkeywords;(2)沛plicits锄锄ticscoul
4、dbereVealedⅡll的ugll0ntolog),inte鲥ion;(3)re跚ltsa∞甑llibited鹪。tllef0册ationofontology'tllerefore邯e瑙c锄obtainintuitionalinf0咖ationconveniently.Keywords:KeywordSearch,S锄锄tic,ontology'HeterogeIleousDataSourc韶CLCNumber:TP3ll’第1章绪论近年来,大量自治的网络系统和网络数据库在mtemet中出现.这些自治
5、系统所管理的数据源形式多种多样,有些是普通文本,有些是关系数据,而有些则是XML数据.尤其是XML格式数据,随着XML逐渐变成IIltenlet上展示和交互数据的标准,大量XML文档和XML数据库出现在网络中.一个自治系统往往根据数据源的不同而提供特定的数据查询接口(例如为文本数据提供关键字查询接口,为关系数据提供SQL查询接口,而为XML数据提供XQue巧查询接口).对于一个特定的领域,不同数据源表达的语义可能相似甚至相同,然而由于数据格式和数据模式的差异,对于每一个不提供关键字搜索接口的数据源,用户都
6、必须事先了解它的数据模式,学习复杂的查询语法,才能组织一定的结构化查询语句获得相应结果.显然,一个合理的需求即是为特定领域的所有异构数据源提供一个共同的关键字搜索接口.但是由此也会带来几个难以解决的问题:(1)关键字搜索方法固有的语义模糊问题,使得用户很难表达自己的搜索语义;(2)由于数据的多样性,很难确定和组织关键字搜索的结果,尤其是结构化和半结构化数据中返回文档片段的情况;(3)由于各数据源彼此之间的异构性,很难将表达相同语义的数据以相同的形式展示给用户,从而也很难将不同数据源之间的结果进行排序.例l
7、:某大学A和某大学B各有一套图书馆管理系统.其中,A大学使用关系数据库存储系统数据,提供SQL查询接口,而B大学使用XML数据库存储系统数据,提供XQue哆查询接口.尽管两个图书馆管理系统包含数据的语义极其相似,然而由于术语使用的差异,以及数据库的不同实现,两个系统的数据是完全异构的(见图1).StIldentBookAuAuthoridname个idtitIesubjecIaUthOridsheILnoStatuSstuiddueda伯1\horbOOkidauthor-.d山idname∞ntact(
8、a)A大学的图书管理系统(基于关系数据库)L.bra拶‘————丁、、~~》m■蚓e∥/—\\_蕊啪yB凑er,、上。./\丘/仆矗蔷磊me@Il锄ePhysics.MathematicsAestb矗icsEpist;mology主thnics\、≮匕乡////@佤丽磊孑譬蕊蠢晶m。e(b)B大学的图书管理系统(基于XML数据库)图1.两个图书馆管理系统的模式结构.A大学的数据库系统由三张关系数据表构成:学生(Student)
此文档下载收益归作者所有