基于启发式信息的deep+web查询接口属性抽取

基于启发式信息的deep+web查询接口属性抽取

ID:33486229

大小:504.23 KB

页数:8页

时间:2019-02-26

基于启发式信息的deep+web查询接口属性抽取_第1页
基于启发式信息的deep+web查询接口属性抽取_第2页
基于启发式信息的deep+web查询接口属性抽取_第3页
基于启发式信息的deep+web查询接口属性抽取_第4页
基于启发式信息的deep+web查询接口属性抽取_第5页
资源描述:

《基于启发式信息的deep+web查询接口属性抽取》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据计算机研究与发展ISSN1000—12391CN11-1777/TPJournalofComputerResearchandDevelopment46(Suppl.):48—54,2009基于启发式信息的DeepWeb查询接口属性抽取梁浩1’2左万利1’3任斐1赫枫龄11(吉林大学计算机科学与技术学院长春130012)2(长春税务学院信息系长春130012)3(符号计算与知识工程教育部重点实验室长春130012)(Liangh434@163.corn)DeepWebQueryInterfaceAttributesExtractionBasedonHeuristi

2、cInformationLiangHa01”,ZuoWanlil”,RenFeil,andHeFenglin911(CollegeofComputerScienceandTechnology,JilinUniversity,Changchun130012)2(DepartmentofInformation,ChangchunTaxationCollege,Changchun,130012)3(KeyLaboratoryofSymbolComputationandKnowledgeEngineeringofMinistryofEducation,Changchun1300

3、12)AbstractE—commerceWebsitesprovideeconomicinformationbythequeryinterfaces,whichareconsideredasWebservicesthatindirectlyreflecttherealschemaofthedeepWeb.ThefirststepofaccessingthedeepWebistoparsequeryinterfaceseffectively.Thequeryinterfacesaredesignedandcodedindifferentdevelopmentmodels

4、usingdifferentprogramminglanguagesandthesemanticrelationisverycomplicatedinthequeryinterfaces.Aimingtoimprovetheaccuracyofextractingattributesandrealizemachine-readablequeryinterfacessemantically,anapproachispresentedtOextracttheattributesbasedonheuristicinformationandsetsofattributesare

5、enrichedutilizingontologytogetdeepsemanticunderstandingofthequeryinterfaces.Extensiveexperimentsoverreal—worddomainsshowtheutilityandabilityofthealgorithmparsingtheinterfacesandextractingvalidattributes.Keywordse-commerce;deepWeb;queryinterface;semanticrelation;heuristicinformation摘要电子商务

6、网站以查询接口的方式提供商务信息,查询接口也是隐藏在后端的DeepWeb数据库模式信息的载体.有效解析查询接口是访问DeepWeb资源的第1步,但是由于查询接口在不同的设计模式和开发语言下实现,所以导致了属性难以抽取、语义关系复杂的现象.为提高属性抽取的准确率且实现在语义层面上对查询接口的解读,提出一种以查询接口启发式信息为基础的属性抽取方法,通过使用本体工具对属性集合进行拓展并获取语义描述.在实际的电子商务网站上进行的广泛实验证明了提出方法的可行性与有效性.关键词电子商务;DeepWeb;查询接口;语义关系;启发式信息中图法分类号TP391随着Internet技术的发

7、展,Web已经成为最大的信息载体并提供前所未有的巨量信息.如今,我们所面对的web以两种方式提供信息服务,首先,由所有可访问到的Web页面信息及图形、PDF和收稿日期:2009—06—19基金项目:国家自然科学基金项目(60973040);国家自然科学杰出青年基金项目(60903098);吉林省科技发展计划基金项目(20070533);高等学校博士学科点专项科研基金项目(200801830021);吉林大学基本科研业务费交叉学科与创新基金项目(200810025)万方数据梁浩等:基于启发式信息的DeepWeb查询接口属性抽取49Word文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。