基于语义的数据格式转换

基于语义的数据格式转换

ID:33780172

大小:1.16 MB

页数:44页

时间:2019-03-01

基于语义的数据格式转换_第1页
基于语义的数据格式转换_第2页
基于语义的数据格式转换_第3页
基于语义的数据格式转换_第4页
基于语义的数据格式转换_第5页
资源描述:

《基于语义的数据格式转换》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河北大学硕士学位论文基于语义的数据格式转换姓名:郝亚南申请学位级别:硕士专业:计算机应用技术指导教师:李天柱20030101摘要随着Internet的迅猛发展,各种基于Web的应用系统不断涌现,同时,对信息资源的共享与交换要求也越来越高。在现有的各种基于Web的应用系统中存在大量的,复杂的不同格式的数据。如何进行Web上各系统之间的数据交换成为一个十分重要的问题。其中的核心是Web上的各种数据格式之间的相互转换,其中‘一些转换涉及到语义的问题。但是,现有的格式转换技术一般仪能完成语法的转换,没能很好的解决语义转换的问

2、题。本文在分析现有的各种数据格式转换技术的基础上,提出了基于语义的数据格式转换方法。该方法以Word文档为例,对Word文档的转换采用基于模板和基丁学习的两种策略,自动地将Word文档转换为XML。同时,为了进行高效的查询,又将转换结果转换为关系型数据作为副本。Word文档只有编辑和显示信息,无语义信息:将之转换为XML后,生成具有语义信息的文档数据,从而完成了基于语义的数据格式转换。该方法支持所见即所得,应用环境没有特殊性,方便了用户使用。另外,该方法采用了领域知识库与文档库相结合的办法,通过图形用户接口,用户可以

3、按领域,根据自己感兴趣的信息,对文档库数据进行查询;也可以对大量Word文档进行精确的基于语义的查询和管理,大大提高工作效率。关键词格式转换:Word;XML;语义AbstractWiththerapiddevelopmentofInternet,moreandmorewebapplicationshavebeendeveloped.Atthesametime,thedemandsofinformationshareandexchangehaveincreasesharply,Amongthecurrentwebap

4、plicationstherearelotsofanddifferentformatsofcomplexdata,SOhowtoexchangedataarnongdifferentwebapplicationshasbecomeanimportantissue,thegoreofwhichisdatatransformation,andsomeofthemrelatetotheproblemofsemantics.Butthecurrenttechniquecanonlyaccomplishthetransform

5、ationbasedonsyntax,notsemantics,thustheydonotsolvetheproblemofsemantics.Afteranalyzingthecurrentdatatransformationtechnique,usinginformationextractiontechnique,ThemethodofdatatransformationbasedonsemanticsiSprovided.Takingexamplefortheworddocument,weadoptthetWO

6、strategiesoftemplateandlearningtoaccomplishtheprocessoftransformation.Theprocessedworddocm-nentsareautomaticallyconvertedintoXMLdocumentsandrelationaldataatthesametimeforthesakeofefficientquery.Worddocumenthasonlyeditanddisplayinformaion,nosemanticsinformation.

7、TheproducedXMLhasaccuratesemanticsinformation,thustransformationbasedonsemanticsisachieved.ThemethodsupportsWYSIWYG(whatyouseeiswhatyouget)andcaneasilybeusedbyusers.Furthermore,domainknowledgedatabaseanddocumentdatabaseareintroducedinoilrmethod.Throughthefriend

8、lyGUIandclassifieddomain,userscancarryoutaccuratequeriesbasedonsemanticsinthedocumentdatabase,queryandmanagelotsofdocumentssemantically,thusworkefficiencyareimprovedlargelyK

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。