欢迎来到天天文库
浏览记录
ID:52209760
大小:480.06 KB
页数:7页
时间:2020-03-25
《基于本体的Deep Web语义分类研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第25卷第2期山东建筑大学学报Vo1.25No.22010焦4月JOURNALOFSHANDONGJIANZHUUNIVERSITYApr.2010文章编号:1673—7644(2010)02—0l18—07基于本体的DeepWeb语义分类研究吕强,宋玲。,马军。,秦英林(1.国家电网技术学院,山东济南250002;2.山东建筑大学计算机科学与技术学院,山东济南250101;3.山东大学计算机科学与技术学院,山东济南250100)摘要:针对目前DeepWeb分类研究中所采用的Post—query查寻探测方法缺乏语义支持的问题
2、,提出一个基于本体的语义查询探测分类方法。主要思想如下:首先针对一个DeepWeb数据库集合,提取查询接口中的属性及其实例,半自动建立领域本体,并且通过领域本体来表示类别特征;然后利用领域本体中的概念以及相应的实例构造语义查询集;最后对待分类的DeepWeb数据库利用语义查询集进行查询探测,计算查询探测返回的结果文档在领域本体中的信息覆盖量,并以此对DeepWeb进行分类。实验表明:这种语义查询探测分类的方法和以往的方法相比,在准确率、查全率和F1值上有一定的提高。关键词:DeepWeb分类;本体;语义;查询探测中图分类号:
3、TP301文献标识码:AResearchonDeepWebsemanticcategorizationbasedonontologyLUQiang,SONGLing2,MAJun,eta1.(1.StateGridTechnologyCollege,Jinan250002,China;2.SchoolofComputerScienceandTechnology,ShandongJianzhuUniversity,Jinan250101,China;3.SchoolofComputerScienceandTechnology,
4、ShandongUniversity,Jinan250100,China)Abstract:InviewoftheproblemoflackingsemanticsupportinthePost-queryresearchofDeepWebdatabasesclassification,thepaperdesignsanovelsemanticqueryprobingclassificationapproachbasedonontology.Themainideaisasfollowing:firstly,attribute
5、sandinstancesareextractedfromqueryinterface,whichareusedtobuilddomainontologiessemi—automatically,andcharacteristicsofcategoriesarerepresentedbydomainontologies.Thendomainqueryinstancesareconstructedfromdomainontologies,whichareusedasqueryprobingtoDeepWebdatabases.
6、Finallycoveragedegreebetweenreturnedresultdocumentsofaqueryanddomainontologiesarecomputed,withwhichtheDeepWebdatabaseisclassified.TheexperimentsshowthatsemanticqueryprobingclassificationmethodWeproposedhasimprovedalotinprecision,recallandF1.Keywords:DeepWebcategori
7、zation;ontology;semanticquery;queryprobing收稿日期:2009一O8—21基金项目:高等学校博士学科点专向科研基金(20070422107);山东省科技攻关计划项目(2007GG10001002)作者简介:吕强(1969一)男,山东平度人,副教授,硕士,主要从事计算智能电网、智能在电力系统中的应用研究.E-mail:sllshm@sina.t:om第2期吕强等:基于本体的DeepWeb语义分类研究词并进行不同的组合,用来对隐藏数据库进行探测,0引言并以此来确定某个隐藏数据库对于某领域的
8、相关度。近来研究表明网络上存在的大量DeepWeb数通过对未知的DeepWeb数据库反复地查询探据库只有通过用户提交一系列关键词给查询接口后测,对返回查询结果进行分析来判断一个DeepWeb才能动态生成查询结果,因此对用户来说这部分页数据库属于哪个领域,这就面临一个如何构造查询面是隐藏的,
此文档下载收益归作者所有