基于本体的web信息采集研究

基于本体的web信息采集研究

ID:32511233

大小:1.47 MB

页数:52页

时间:2019-02-10

基于本体的web信息采集研究_第1页
基于本体的web信息采集研究_第2页
基于本体的web信息采集研究_第3页
基于本体的web信息采集研究_第4页
基于本体的web信息采集研究_第5页
资源描述:

《基于本体的web信息采集研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要目前Web上的信息是面向用户的,计算机无法理解,因此传统信息检索方式下,检索到的数据往往仅仅反映内容的一个侧面。在用户的需求信息和Web上的数据计算机无法准确的理解的情况下,在表示信息的Web和使用信息的用户之间产生了一道语义屏障。语义Web作为目前Web的一个延伸,目标是使Web上的数据具有机器可识别的语义,便于人机之间的交互与合作。本文的工作主要围绕一下几个方面展开。首先,介绍了TimBemers—Lee提出的语义Web和基于主题的信息检索。在分析目前语义Web和基于主题信息检索研究现状的基础上,提出了本文

2、的研究方向。在实验室研究项目——基于本体的XML数据集成和查询研究系统框架下展开研究。其次,阐述了论文涉及到的本体构建、Web信息采集、页面内容分析和主题相关度计算等关键技术以及面临的难点。并且针对每一个问题,提出了相应的可行的解决方案。为下面基于本体的Web信息采集系统的设计实现提供了理论和实践基础。再次,设计了一个基于本体的Web信息采集系统一一Ontowing。详细介绍了系统的框架结构及工作流程、主要组成及各个部分的功能。作为SNAX系统的子系统,通过将语义网技术同信息检索技术的结合实现了系统用户相关信息资源

3、的采集。最后,进行了系统实现,并通过实验验证了理论的有效性。对所做工作进行了总结和展望。关键词语义Web,本体,信息采集,主题相关度计算ABSTRACT4IhedataoncurrentWebcannotbeunderstoodbythemachinebecausethesedataareuser-oriented.Therefore,thedataretrievedthroughtraditionalretrievalmeanscanonlyshowonefacetofthecontentrepresentedb

4、ydata.Whencomputercannotpreciselyunderstanduser'srequirementsandWebdata.semanticobstaclesbetweenWebdataandusersarise.AsadevelopmentofcurrentWeb.SemanticWebaimstoenrichtheWebdatawithsemanticformatandmakethemmachine—readable.ThusitwillbeconvenientforhumantoCO—op

5、erate.Thethesisachievesnextresults:Firstly,semanticwebproposedbyTimBemers-Leeandtopic—basedinformationretrievalhavebeenintroduced.BasedonanalyzingcurrentsituationofsemanticWebandtopic-basedinformationretrievalresearch,theresearchdirectioninthethesisareputforwa

6、rd.Secondly,ontologyconstruction,Webdatacollecting,Webpageanalysis.topicrelevancyandetc.areelaborated.111efeasiblesolutionshavebeenrespectivelyproposedforeachissuediscussedabove.Theseprovidetheoreticalandpracticalfoundationforupcomingdesignofontology—basedWebi

7、nformationcollectingsystem.Thirdly.Ontology—basedfocusedcrawlersystem(Ontowing)isdesignedandimplemented.Theframework,workingprocedure.componentsandfunctionalitiesofOntowingareelaborated.Asasub-systemofSNAx.throughcombiningsemanticWebtechnologywithinformationre

8、trievaltechnology,Ontowingrealizesuser'srelatedinformationandresourcescollecting.Finally,experimenthasbeendonetojustifytheproposedtheory.Thesummaryandexpectationoftheresearchhavebe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。