欢迎来到天天文库
浏览记录
ID:53572553
大小:224.59 KB
页数:6页
时间:2020-04-19
《异构信息源集成技术.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第22卷第5期北京理工大学学报Vol.22No.52002年10月JournalofBeijingInstituteofTechnologyOct.2002"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""文章编号:1001-0645(2002D05-0533-04异构信息源集成技术宋瀚涛(北京理工大学计算机科学与工程系9北京100081D摘要:异构信息源集成技术提供统一接口9使各种基于因特网的应用能迅速,准确地提取所需信息9为用户屏蔽各种信息源的异构性~这种异构信息源的集成技术从传统的结构化的
2、异构数据库扩大到半结构化的大量Web页面信息及无结构的信息~对集成技术的方法9如数据模型,Web信息,描述语言XML,主流软件开发技术及信息智能搜索,查询重写,查询分析等进行了分析9给出了半结构化异构信息源集成的系统架构9并指出该项技术未来发展趋势~关键词:异构信息集成;半结构化信息;信息智能搜索;查询重写;查询分析中图分类号:TP311-13文献标识码:AIntegrationTechnologyofheterogeneousInformationSourcesSONG~an-tao(Dept.ofComputerScienceandengineering9BeijingIn
3、stituteofTechnology9Beijing1000819ChinaDAbstract:TodiscussthetechnologyofintegrationofheterogeneousinformationsourceswhichcanprovideaunifiedinterfacetomakeuseofvariousheterogeneousinformationsourcesfortheinformationmoderniZationofenterprisesandapplicationsbasedonInternet.Itshieldsthehetero-g
4、eneousinformationsourcesforusersandapplications.Soitiseasytoextracttheneededinfor-mationguickly.TheintegrationtechnologyofheterogeneousinformationsourcesisexpandedfromtraditionalstructureddatabasestosemistructuredWebpagesandnonstructuredinforma-tion.ThispaperanalyZesthetechnicalapproachesofi
5、ntegratingheterogeneousinformationsources9suchasdatamodel9Webinformation9descriptionlaguageXML9maincurrentofsoft-waredevelopmenttechnology9informationintelligentsearch9gueryrewriteandgueryanalysis.Trendsofdevelopmentofthisfieldareexpected.Keywords:heterogeneousinformationintegration;semistru
6、cturedinformation;informationin-telligentsearch;gueryrewrite;gueryanalysisheterogeneousinformationresourceD.企业建立数1异构信息源集成的需求与现状据库进行数据挖掘和OLAP等业务活动也需要异大型企业经过多年信息化建设9积累了大量的构信息源集成系统提供一个使用多种信息源的统一多种形式的信息资源9企业的应用向集成化发展9首接口9用户只需提出其需要何种信息9而不必关心如先面临的是异构信息源的集成I~IR(integrationof何去链接异构信息源及如何去查询所需结果[1!9如
7、收稿日期:20020823基金项目:总装备部预研项目作者简介:宋瀚涛(1940D9男9教授9博士生导师~534北京理工大学学报第22卷果没有IHIR系统,用户需要与各个信息源分别交用.该方法中系统总体分为3层结构:物理层~中间互,并用个性化的查询手段从各信息源去查询所需层和界面层.物理层是指各异构数据源,界面层是提信息,再把这些信息汇总起来.而IHIR系统可以将供给用户的接口,在这两层之间是屏蔽数据源异构用户从繁琐的工作中解脱,为用户使用多种异构信性的中间件层.该方法的关键技术是全局数据模型
此文档下载收益归作者所有