欢迎来到天天文库
浏览记录
ID:34534589
大小:2.89 MB
页数:3页
时间:2019-03-07
《计算机半结构化数据源的数据挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计算机半结构化数据源的数据挖掘技术研究何月顺1,2,丁秋林1(1.南京航空航天大学计算机应用研究所,江苏南京210016;2.东华理工学院计算机与通信系,江西抚州344000)摘要:web是一个动态性极强的信息源,要访问、分析这些信息必须要研究异构数据的集成问题和选择合适的技术进行数据分析、集成和处理.介绍了多数据源数据仓库体系结构,分析了转换器在面向Web的数据挖掘中存在的不足和XML语言的技术特点;提出了多数据源数据的集成思想和实现的框架以及基于半结构化数据源的数据挖掘方法,提出了应用XML技术对多数据源数据进行集成与转换以便构建数据仓库的方法,同时给出了实现的关
2、键技术.关键词:数据仓库;数据挖掘;异构数据;半结构化中图分类号:TP302文献标识码:A文章编号:0367-6234(2005)10-1363-03Techniqueresearchofdataminingbasedonsemi-structuredatasourceHEYue-shun1,2,DINGQiu-Lin1(1.InstituteofComputerApplication,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China;2.Dept.ofComputerCommulica
3、tion,EastChinaInstituteofTechnology,Fuzhou344000,China)Abstract:Thewebwasaninformationresourcewithdynamicstate,toaccessandanalyzethedatumwemuststudyhowtointegrateheterogeneousarchitecturedatumandchoosefittechniquestoanalyzeandintegrateandmanagethedatum.Inthepaper,datawarehousearchitectu
4、reofmultipledatasourcewasintroduced,thedefi-cienciesofthewrapperinorientedWebdataminingwerepointedoutandthetechniquecharacteristicsoftheXMLLanguagewereanalyzed.Theideaofdataintegrationandtheframeofimplementationwerepresented;Thetechniqueofdataminingwasputforwardbasedonsemi-structuredata
5、source;thetechniqueofusingXMLwasadvancedforintegratingandtransformingmultipledatasourceandcomposingdatawarehouse.Also,animplementationmethodwaspresentedforthekeytechnology.Keywords:datawarehouse;datamining;heterogeneousarchitecturedata;semi-structure
此文档下载收益归作者所有