高端容错计算机系统监测平台的设计与实现

高端容错计算机系统监测平台的设计与实现

ID:33294191

大小:1.87 MB

页数:76页

时间:2019-02-23

高端容错计算机系统监测平台的设计与实现_第1页
高端容错计算机系统监测平台的设计与实现_第2页
高端容错计算机系统监测平台的设计与实现_第3页
高端容错计算机系统监测平台的设计与实现_第4页
高端容错计算机系统监测平台的设计与实现_第5页
资源描述:

《高端容错计算机系统监测平台的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文高端容错计算机系统监测平台的设计与实现DESIGNANDIMPLEMENTATIONOFMONITORINGSYSTEMFORHIGH-PERFORMANCEFAULT-TOLERANTCOMPUTER王力哈尔滨工业大学2011年6月国内图书分类号:TP302.8学校代码:10213国际图书分类号:681.39密级:公开工程硕士学位论文高端容错计算机系统监测平台设计与实现硕士研究生:王力导师:杨孝宗教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技术学院答辩日期:2011年6月授予学位单位:哈尔滨工业大学Class

2、ifiedIndex:TP302.8U.D.C:681.39DissertationfortheMasterDegreeinEngineeringDESIGNANDIMPLEMENTATIONOFMONITORINGSYSTEMFORHIGH-PERFORMANCEFAULT-TOLERANTCOMPUTERCandidate:WangLiSupervisor:Prof.YangXiaozongAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerTechnology

3、Affiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2011Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要计算机系统已经广泛应用于各个领域,用户在使用计算机系统提供的强大服务的同时也非常关心系统本身的运行状况,确定系统是否存在潜在的问题。计算机系统监测正是完成这一任务。如今,计算机系统监测已发展成一个重要的研究方向。高端容错计算机硬件结构复杂,运行的操作系统

4、庞大,提供的服务众多,无论在对其评估和测量还是日常维护过程中,系统监测都是必不可少的。本文面向高端容错计算机设计和实现了系统监测平台。采用远程监控架构,用软件监控方法进行带内监测,又利用计算机的监控硬件实施带外监测,实现对高端容错计算机系统全方位、多层级监测的目标。首先本文研究和分析了国内外现有的计算机系统监测方法和工具,针对高端容错计算机体系结构和操作系统的特点设计监测平台的功能、监测指标和总体研究方案。根据监测指标的层次,设计了三个监测工具,分别实现对高端容错计算机应用层、系统内核层和硬件部件层的监测。性能监测工具基于内核数据结构获取

5、系统性能数据,实现对系统CPU、内存、网络、磁盘、系统进程等关键应用性能的监测。内核探测工具基于内核调试技术实现动态探测系统内核行为,能够探测CPU寄存器和全局数据结构中的数值,也能探测指定进程的内核栈内容,分析内核执行路径和调度信息。硬件部件监测工具利用智能平台管理接口(IPMI)监测高端容错计算机底层硬件,能够实时监测硬件部件状态。硬件部件监测工具即使在操作系统关机或发生故障无法提供服务时仍然可以实施监测,是一种带外监控方式。最后本文通过实验验证了系统监测平台的有效性,各个监测工具实现了设计方案中指定的监测指标。系统监测平台在高端容错

6、计算机评测过程中发挥了较重要作用,能够验证负载模拟和故障注入结果的有效性,同时也为容错性和可用性评测提供数据支持。关键词:系统监测;性能监测;内核探测;智能平台管理接口-I-哈尔滨工业大学工程硕士学位论文AbstractNow,computersystemmonitoringhasdevelopedintoanimportantresearchdirection.High-endfault-tolerantcomputerhascomplexstructureofhardware,runninghugeoperatingsystemand

7、providesnumberofservices.Bothinitsassessmentandmeasurement,orthedailymanagementandmaintenance,thedepartmentofmonitoringsystemsareessential.Thispaperdesignedanddevelopedamonitoringsystemforthehigh-endfault-tolerantcomputer.Thissystemisimplementedasaremotemonitoringarchitec

8、ture,usingbothsoftwaremethodsandhardwaremethods.Accordingtothelayeroftheindicators,thispaperdesi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。