欢迎来到天天文库
浏览记录
ID:33486229
大小:504.23 KB
页数:8页
时间:2019-02-26
《基于启发式信息的deep+web查询接口属性抽取》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、万方数据计算机研究与发展ISSN1000—12391CN11-1777/TPJournalofComputerResearchandDevelopment46(Suppl.):48—54,2009基于启发式信息的DeepWeb查询接口属性抽取梁浩1’2左万利1’3任斐1赫枫龄11(吉林大学计算机科学与技术学院长春130012)2(长春税务学院信息系长春130012)3(符号计算与知识工程教育部重点实验室长春130012)(Liangh434@163.corn)DeepWebQueryInterfaceAttributesExtractionBasedonHeuristi
2、cInformationLiangHa01”,ZuoWanlil”,RenFeil,andHeFenglin911(CollegeofComputerScienceandTechnology,JilinUniversity,Changchun130012)2(DepartmentofInformation,ChangchunTaxationCollege,Changchun,130012)3(KeyLaboratoryofSymbolComputationandKnowledgeEngineeringofMinistryofEducation,Changchun1300
3、12)AbstractE—commerceWebsitesprovideeconomicinformationbythequeryinterfaces,whichareconsideredasWebservicesthatindirectlyreflecttherealschemaofthedeepWeb.ThefirststepofaccessingthedeepWebistoparsequeryinterfaceseffectively.Thequeryinterfacesaredesignedandcodedindifferentdevelopmentmodels
4、usingdifferentprogramminglanguagesandthesemanticrelationisverycomplicatedinthequeryinterfaces.Aimingtoimprovetheaccuracyofextractingattributesandrealizemachine-readablequeryinterfacessemantically,anapproachispresentedtOextracttheattributesbasedonheuristicinformationandsetsofattributesare
5、enrichedutilizingontologytogetdeepsemanticunderstandingofthequeryinterfaces.Extensiveexperimentsoverreal—worddomainsshowtheutilityandabilityofthealgorithmparsingtheinterfacesandextractingvalidattributes.Keywordse-commerce;deepWeb;queryinterface;semanticrelation;heuristicinformation摘要电子商务
6、网站以查询接口的方式提供商务信息,查询接口也是隐藏在后端的DeepWeb数据库模式信息的载体.有效解析查询接口是访问DeepWeb资源的第1步,但是由于查询接口在不同的设计模式和开发语言下实现,所以导致了属性难以抽取、语义关系复杂的现象.为提高属性抽取的准确率且实现在语义层面上对查询接口的解读,提出一种以查询接口启发式信息为基础的属性抽取方法,通过使用本体工具对属性集合进行拓展并获取语义描述.在实际的电子商务网站上进行的广泛实验证明了提出方法的可行性与有效性.关键词电子商务;DeepWeb;查询接口;语义关系;启发式信息中图法分类号TP391随着Internet技术的发
7、展,Web已经成为最大的信息载体并提供前所未有的巨量信息.如今,我们所面对的web以两种方式提供信息服务,首先,由所有可访问到的Web页面信息及图形、PDF和收稿日期:2009—06—19基金项目:国家自然科学基金项目(60973040);国家自然科学杰出青年基金项目(60903098);吉林省科技发展计划基金项目(20070533);高等学校博士学科点专项科研基金项目(200801830021);吉林大学基本科研业务费交叉学科与创新基金项目(200810025)万方数据梁浩等:基于启发式信息的DeepWeb查询接口属性抽取49Word文
此文档下载收益归作者所有