欢迎来到天天文库
浏览记录
ID:51224275
大小:8.83 MB
页数:72页
时间:2020-03-21
《基于回归树与K-最近邻交互模型的存储设备性能预测.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、中国科学技术大学硕士学位论基于回归树与K.最近邻交互模型的存储设备性能预测作者姓名:学科专业:导师姓名:完成时间:郭昌辉计算机应用技术刘贵全副教授二O一二年四月二十二日▲又嗍iIllll籼ilUlU咖illUl啪uu舢咖砌卿硼聊Y2125274UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeAnInteractiveModeIBasedonReqressionTreeandK_Nearest_NeighborsforStorageDevice。Performa
2、ncePredIC“On一一-一■■Author’SName"ChangHuiGuospeciality:ComputerApplicationTechnologySupervisor:Assoc.Pro£GuiQuanLiuFinishedtime:April22加,2012中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过韵研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确韵说明。作者签名:签字日期:塑!!:
3、!:!!中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。函公开口保密(——年)作者签名:料新签名:坼气签字日期:摘要_一一——————————————————————————————
4、————_———————————一摘要存储设备性能预测在存储系统的自动化管理以及任务计划程序中具有广泛的应用,占有重要的地位。传统的方法是利用分析模型、仿真模型来预测存储设备性能,并称这类方法为白盒方法。因为这类方法主要依据目标存储设备的内部架构、调度算法等大量领域知识进行模拟和分析并构建相应预测模型。然后随着存储设备日益高端、复杂,特别是设备生产商不愿意公开其设备内部参数,模拟和分析模型很难实现,这使得白盒方法很难成为存储设备性能预测的一种通用的解决方案。与自盒方法相对应的一种设备性能建模方法称为黑盒方法。黑盒方法的优点是不需要了解目标设备的任何
5、内部信息,它将所有设备都看成一个黑盒,仅仅使用统计或机器学习方法依据该设备上历史数据来探索设备的行为习性并建立预测模型。CART是一种可以完成回归任务的机器学习方法,使用该方法来构建存储设备的预测模型具有很多优点,如简单、预测速度快、对不相关属性鲁棒且具有可解释性,但CART模型对噪音数据敏感且稳定性差,还有其预测精度不够高,低于K.最近邻方法。为了获得更好的预测性能,本文提出一种基于回归树与尽最近邻交互模型的存储设备性能预测方法,该方法主要利用回归树与K.最近邻间具备的潜在的优劣互补性。在该交互模型中,首先利用训练数据集构建一棵标准的回归树,然后
6、统计每个内部分裂节点并依据一定规则计算出每个属性在树的生成过程中所做贡献,亦称为属性权重,这有助于直观理解;其次,利用前面计算出的属性权重,在叶节点使用加权的K.最近邻交互模型取代原来回归树的预测方法,即使用叶节点上所有实例的输出属性值的均值来预测未知实例;最后,提出了一种预测的平滑算法,该算法利用从叶节点到根节点路径上节点的信息迭代式修正预测值,目标是获得更好的泛化性能和预测准确度。实验表明,本文提出的交互模型较单一的回归树模型或K.最近邻模型有更好的稳定性和预测性能,且具备可解释性。构建设备性能模型的一个重要方面就是如何全面、准确地对工作负载进
7、行恰当的描述,即工作负载特征化。Wang提出的基于I/o请求的工作负载特征化过程中,为了描述I/O到达的突发率,需要确定一个窗口。Wang通过实验并分析每个特征的相对重要性,然后以此为基础来确定该参数的大小。该方法需要多次重复实验,然后认真选择大小。即便如此,这种方法也很难获得理论上的解释。本文提出一种统计方法,通过统计数据集中同类任务的最大突发率,也就是说对任一进入系统的I/O请求,在其前面等待被执行的I/O的最大值。采用这种方法的理由是,已经执行完的I/O不会再对刚进入系统的F0构成影响,仅仅是排队摘要等待的I/O请求才会影响该I/O请求。此外
8、,本文发现Wang遗失了一个非常重要的特征——缓存效应,因为当一个I/O请求所需数据部分或全部存在于缓存中,则减少与慢速磁
此文档下载收益归作者所有