基于数据立方体的预测模型研究

基于数据立方体的预测模型研究

ID:33130820

大小:2.28 MB

页数:76页

时间:2019-02-21

基于数据立方体的预测模型研究_第1页
基于数据立方体的预测模型研究_第2页
基于数据立方体的预测模型研究_第3页
基于数据立方体的预测模型研究_第4页
基于数据立方体的预测模型研究_第5页
资源描述:

《基于数据立方体的预测模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文基于数据立方体的预测模型研究姓名:高俊波申请学位级别:硕士专业:计算机应用指导教师:蔡庆生2000.10.1摘要\数据库中的知识发现(KnowledgeDiscoverinDatabase,简称KDD)是一个从数据库中提取非平凡的、隐式的、未知的及有潜在的应用价值的信息的过程。它是一个由多学科,特别是人工智能与数据库,相互渗透形成的一门新兴学科,它不仅具有广阔应用背景,而且具有深远的理论意义。预测是指预测数据库或数据仓库中特定属性的潜在值或值的分布,是数据挖掘领域一项非常吸引人的挖掘任务。对数据库中潜在的信息进行高

2、质量的预测,能够帮助用户做出正确的商业决策。出于对预测的高质量和平稳性的要求,我们提出了~种预测模型算法用于大型数据库和数据仓库的预测。我们的研究方法分为三步:第一步:数据泛化。能够将关系数据库或数据仓库转化成能够进行高效分析的多维数据库。第二步:相关性分析,可以找出跟预测任务相关性强的属性,去除相关性不强的属性,从而减少了用于预测任务的属性数目,提高了预测的效率和可信度。第三步:采用一类统计回归模型,即归纳线性模型,进行高质量的预测。在本文中,我们采用了两种模型来处理不同的问题。利用这种方法,用户可以同数据挖掘系统进行交互,在不同的抽象层上

3、不断探视,尝试在不同的抽象层上预测被预测属性的值。而且,用户可以沿着任何一个属性维进行向上和向下钻取进行预测分析。我们的试验表明,本文的方法可以在适度的数据泛化基础上进行高质量的预测,是一种高效的、交互式的大型数据库预测方法。,本文工作的独特之处在于:1.采取基于数据立方体技术和相关性分析方法的数据预处理方法,极大地减少了数据集的规模,使预测算法能够更为高效地得到应用。2.将传统的统计方法和多维分析及概念层次相结合,能够从多维视图的数据模型中进行预测分析,并实现了多层次的预测。3.设计并实现了一个基于数据仓库的预钡£三县!并在实际项目中得到了

4、应用。Abstractknowledgediscoveryindatabases(KDD),hasbeenknownasaprocessofnontrivialextractionofimplicit,previouslyunknownandpotentiallyusefulinformation(includesinterestingknowledgerules,constraints,regularities,etc.Ithasbeenrecognizedbymanyresearchersasakeyresearchtopicindata

5、basesystemsandmachinelearning,whichisinfactailintegrationoftechniquesfrommultipledisciplinessuchaSdatabasetechnology,statistics,machinelearning,highperformancecomputing,pattemrecognition,neuralnetworks,datavisualization,informationretrieval,imagedatabase,signalprocessing,an

6、dspatialdataanalysis.Prediction,i.e.,predictingthepotentialvaluesorvaluedistributionsofcertainattributesforobjectsinadatabIaseordatawarehouse.iSanattractivegoalindatamining.TopredictfutureeventsnotshownindatabaseswithhigllqualityCanhelpuserstomakesmartbusinessdecisions.With

7、t}1econcemofbothSCalabilityandhighqualityofprediction,weproposeapredictivemodelingalgorithmforinteractivepredictioninlargedatabaseanddatawarehouse.Thealgorithmconsistsofthreesteps:(1)datageneralization.whichconvertsdatainrelationaldatabaseordatawarehouseintoamulti-dimension

8、aldatabasestowhichemcientanalysistechniquesCanbeapplied;(2)relevanceanalysis,which

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。