云资源池探针的故障检测方法研究

云资源池探针的故障检测方法研究

ID:28045694

大小:17.87 KB

页数:5页

时间:2018-12-07

云资源池探针的故障检测方法研究_第1页
云资源池探针的故障检测方法研究_第2页
云资源池探针的故障检测方法研究_第3页
云资源池探针的故障检测方法研究_第4页
云资源池探针的故障检测方法研究_第5页
资源描述:

《云资源池探针的故障检测方法研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。云资源池探针的故障检测方法研究  摘要:随着大数据时代的发展,人们越来越重视保存历史数据,通过海量的历史数据挖掘数据潜藏的价值。在云计算与大数据发展的背景下,虚拟化资源产生的大量状态文件、日志信息将为云平台的故障诊断与预测提供了有力地预测与快速定位依据。通过建立探针机制的挖掘虚拟化资源池日志等信息,找出其中潜在的关联信息。本文构建云计算资源池的大数据分析模型,通过利用大

2、数据技术对资源池各管理层日志进行关联性分析,快速对故障和性能瓶颈进行探查,准确给出探查出的每层资源故障路後或性能瓶颈轨迹,以智能化的方式替换随机性和经验性的人工模式?通过注入云计算操作系统的控制台接口和日志、利用SDN技术对网络流量进行采集、通过存储虚拟化控制工具采集存储性能和日志,再结合现有应用性能分析系统API接口开发,研发基于探针技术的资源池故障及性能分析探针系统。通过该模型系统能对不同资源类型的数据和日志进行综合分析,从这些数据中捕获隐患信息和故障发生点的位置信息并予以可视化表示。  关键词:大数据;虚拟化;资源池探针;故障检测  中图

3、分类号:文献标识码ADOI:/  本文著�格式:权鹏宇,车文刚,余任,等云资源池探针的故障检测方法研究[J]软件,XX,38:13本141  引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  在云计算与大数据发展的背景下,虚拟化

4、资源产生的大量状态文件、日志信息将为云平台的故障诊断与预测提供了有力地预测与快速定位依据。通过建立探针机制的挖掘虚拟化资源池日志等信息,找出其中潜在的关联信息。  故障诊断的目的是寻找故障发生的原因或故障位置,加快修复过程。故障和失效的关系往往异常的复杂,很难直接描述从故障到失效直接的关系。故障诊断通过检测诊断对象的故障模式,提取故障特征,根据预定的推理原则,评估故障信息,向上层做出提示,以便于故障修复。  云计算环境中,数据量庞大,人工直接进行故障诊断在很大程度上依赖于系统管理员的经验,其可靠性很难保证,所以人工无法应对云资源需求。由于没有参

5、考,诊断错误很难被发现与更正。为了避免人为因素带来的影响与误差,对于故障诊断现多使用一定的模型来进行,如神经网络、模糊逻辑等。使用故障诊断模型可以降低由专家经验等人为因素所带来的偶然性与主观性,提高诊断的精确度。  探针监测基础信息资源  由于计算机的CPU、内存、网络和磁盘资源的消耗不仅能够反映出机器当前运行的状态,还能帮助判断主机当前是否出现异常,通过建立探针技术方式获取CPU、内存、网络和磁盘资源是整个故障与可靠性。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学

6、生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  基于上述原因,本文提出了基于各型号虚拟化产品提供的事件API作二次开发,通过采集事件的分级和告警做故障的判断、日志分析、运行状态判断,可在资源池中物理服务器众多、承载大量虚拟服务器的情况下,快速发现已发生的故障,并提供控制台准确预测和定位故障。  1系统设计  系统架构设计  通过建立主动式监测探针,获取

7、云计算操作系统的控制台接口和日志、利用SNMP协议对网络资源信息进行采集、通过存储虚拟化控制工具以及SNMP协议访问存储设备OID号采集存储设备的性能数据通过存储虚拟化控制工具采集存储性能和日志,再结合VMwarevSphere接口开发数据源探针,实现对资源池内的虚拟资源,以及承载虚拟资源的主机设备、网络设备等对象的信息远程探针。故障监控系统主要由数据采集系统、数据分析系统和数据可视化三个子系统组成。系统总体架构如图1所示:  分析与快速定位的基石。目前关于单点故障检测技术已经很成熟,通过资源监控来监测CPU压力、网络带宽得出当前虚拟机的运行情

8、况。云平台下虚拟化资源池包括计算资源池、网络资源池和存储资源池,通过底层监控系统获得虚拟机CPU、内存、磁盘10等指标。虚拟机网络包括网络ICMP报文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。