基于主题本体的信息采集模型研究

基于主题本体的信息采集模型研究

ID:40918231

大小:370.92 KB

页数:5页

时间:2019-08-10

基于主题本体的信息采集模型研究_第1页
基于主题本体的信息采集模型研究_第2页
基于主题本体的信息采集模型研究_第3页
基于主题本体的信息采集模型研究_第4页
基于主题本体的信息采集模型研究_第5页
资源描述:

《基于主题本体的信息采集模型研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第19卷.第l0期计算机技术与发展V01.19No.102009年1O月COMPUTERTECHN0IoGYANDDEVELOPMENTOct.2009基于主题本体的信息采集模型研究拜战胜一,徐德智,彭佳红2,陈光仪,2(1.中南大学信息科学与工程学院,湖南长沙410083;2.湖南农业大学信息科学技术学院,湖南长沙410128)摘要:互联网上的海量信息,至今还在快速发展,面向主题的信息检索已成为当前的研究热点之一。在提高信息检索的精度方面,一般认为本体技术是解决方法之一。在对领域本体技术和传统的基于主题的信

2、息采集技术的基础上,设计了一个基于领域本体的信息采集模型,给出了模型的体系结构,提出了一种关键词加权的词性相关性计算方法以及利用领域本体及对应的词典判定主题相关度的算法。通过实验验证了所提出的方法在提高检索的准确率方面具有明显的优势。关键词:主题本体;领域本体;信息采集;主题相关度中图分类号:TP39l文献标识码:A文章编号:1673—629X(2009)1O一0102—04ResearchofaModelofWebInformationAcquisitionBasedonTopic..OntologyBAI

3、Zhan—sheng,一,XUDe—zhi,PENGJia-hong2,CHENGuang—yi,(1.CollegeofInhnrnationScienceandEngineering,CentralSouthUniversity,Changsha410083,China;2.CollegeofInformationScienceandFechnology,HunanAgricultureUniversity,Changsha410128,China)Al~traet:Therearehugeamounto

4、fWebpagesinIntemet.andthey&restilincreasingrapidly.Thetopic—specificWebinformationre-tfiev~hasbeenoneofthehotspotbeingstudiedatpresent.Ontologytechnologyisconsideredtobeoneofthesolutioninimprovingre—trievalaccruaey.Inthispaper,combinedomain—ontologytechnolo

5、gywiththetraditionalinformationretrievaltechnology.AmodelofWebinformationacquisitionbaseddomain—ontologyisdesignedandthearchitectureofthemodelisgiven.Proposesanapproachforcal·e~atingtherelevancebetweentheWebpagesandthepredefinedtopicutilizingdomain—ontology

6、andlexicon.Atlast,someresultsofex—perirnentindicatethatourn)0de1hasobviouslyadvantageinimprovingretrievalaccuracy.Keywords:topic—ontology;domain—onmlogy;informationacquisition;topic—specificrelevanceO引言做了将本体论应用到信息检索领域的尝试[4-6]。文献随着Internet的快速发展,Web已经成为全球最[7~

7、9]主要研究通用本体在信息检索及NLP中的应重要的信息源,如何有效地获取和利用这些资源成了用,但是目前要建立一个能够涵盖所有领域知识的通一个重要的研究课题。虽然搜索引擎在web检索信用本体几乎是不可能的,比较可行的方法是先建立某息方面为用户提供了很大的帮助,但是通用性搜索引个领域的本体去解决该领域的特定的信息检索问题。擎无法很好地为用户提供特定主题的信息,另外基于文中在对领域本体和主题信息采集技术研究的基关键字的技术也使得搜索引擎缺乏提供对语义的支础上,设计了一个基于计算机软件的领域本体的信息持。要解决这一问

8、题,有研究表明[1-3],基于本体的技采集模型,给出了模型的体系结构,介绍了相关模块。术是解决方法之一。本体不仅为规范化描述资源提供了基础,也为更1基于主题本体的信息采集模型准确地搜索信息提供了保障。目前已经有很多的研究1.1体系结构在对本体技术和主题信息采集研究的基础上,设收稿日期:2009一O2—24;修回日期:2009—05—14计了一种基于领域本体的信息采集模型其体系结构,基金项目:湖南省教

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。