品高云监控预警体系初探.docx

品高云监控预警体系初探.docx

ID:62654921

大小:290.20 KB

页数:19页

时间:2021-05-15

品高云监控预警体系初探.docx_第1页
品高云监控预警体系初探.docx_第2页
品高云监控预警体系初探.docx_第3页
品高云监控预警体系初探.docx_第4页
品高云监控预警体系初探.docx_第5页
资源描述:

《品高云监控预警体系初探.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、品高云监控预警体系初探

2、品高云公开课小编的话品高云公开课”系列文章意在分享技术牛人的知识干货,和大家一起交流学习云知识,每期主题都不一样哟!期待各位读者在文后发表留言,来一场技术上的交流和思想上的碰撞!2016年7月27日本期品高云公开课,由李志伟带来品高云监控预警体系初探”的分享。分享嘉宾李志伟目前就任品高广州云架构产品部BingoCloud平台软件开发工程师,从事云平台开发工作7年,熟悉云平台整体架构,参与多个云服务,如EC2ELBCWAutoScaling、SNS^的开发。分享正文有人说,云计算拼的就是运维能力。随着云平台规模的不扩大,运维的难

3、度也呈直线上升,云平台的监控预警系统变得越来越重要。提到监控预警系统,很多人的第一反应就是:可通过各种图表查看各个监控项的状态;可对监控项设置警报,达到一定阀值时告警,能通过邮件、短信等方式通知到管理员,等等。这些确实是大多数监控系统的基本功能,但对于传统的监控系统,更倾向于发现问题,通知管理员处理。在云计算的时代,监控能否做得更多呢?下面我将为大家介绍一下品高云的监控系统。品高云作为一个自主研发的,遵循亚马逊接口标准的云平台,其监控系统也不例外。品高云的监控系统,即云监控服务,在兼容亚马逊CloudWatch接口的基础上,作了大量的优化与扩展,方便

4、管理员和用户的使用。作为监控系统,首先要确定监控的内容,即监控指标。每一种云资源都会有内置的一些监控指标,如实例的CPU使用率、网络I/O;存储卷的磁盘I/O,读写操作数,等等。管理员可查看、管理云平台的各项监控指标牖二■K京典唇HEM♦叁・Wn与性耳落ItWTCiBM,修*"HtLljjr.**1■■吨・CBS4esumaiiii11iii"•144卜H■冷"寓胃事-IR<9S»•.所B1RCPVL3DinSen■/口hmmumrQiCM舌一O(eRlIR口45

5、闺弹■■情■.JH网ZUMnnLMVQiUH■■FQfMKMViH4i>Kfle・酬%nin*mn友台KflMfeA第MTIR阳・■!W1*FI.■gj।■「MIYIWT用■/■■L;司•.Vfl*(图:监控设置)如果云平台内置监控指标不能满足需求,怎么办呢?没关系,我们支持自定义监控指标。只需要按要求撰写好数据采集脚本、新建监控指标即可。下面以监控MySQL连接数为例,展示如何在品高云监控服务自定义指标:1.撰写数据采集脚本,并由管理员上传到云平台指定目录:[root@bc-test-clcaecJconfig]#catnysql.sh#!/btn

6、/bashusage=^netstat-anpt

7、grep3306

8、grep-i'ESTABLISHED'

9、wc-1echomonoutput:$usageCount[root^bc-test-clcaecZconfig]#(图:脚本)2.新建监控指标,填写相关参数:(图:新建指标)数据采集脚本是在哪里运行的呢?这与监控指标的设置有关。监控指标的收集方式包括ec2confi金口controllerec2config是内置在云平台镜像里面的一个程序,可与云平台交互,实现更多的功能。收集方式选择ec2config,即是由该程序在实例内部运行采集脚本,并通

10、过特定的URL汇报到云平台。controller,即由云平台物理机运行采集脚本。自定义监控指标默认都通过ec2config采集数据定义好监控指标,云平台便会根据设定定时去收集、汇总数据。我们可以到各个资源的详情页面,查看该资源相关指标的监控数据。.破・JW・・J♦咋用।I,自■因事国Q%BojiimttaiSU0幸存♦阳*;R因

11、席也下!窄■0科♦上僭AW:-禅帝,■■等・首的口・j・,*,(图:监控图表)有监控数据只是第一步,我们要如何利用这些数据去完成更多的操作呢?答案就是:监控警报。对于亚马逊CloudWatch,一个监控警报只对应一个云资源的

12、一个监控指标;如果想监控100个实例的CPU使用率,必须重复建100遍。品高云对此作出改进,将监控警报拆分为警报定义跟监控项类型、触发条件、触发操作等通用定义,与具体云资源无关。创建警报爱型任意过例“般怦:匚PLr使用塞*]平均值警报定义包括警报80%持情5分弹触发阳作二]蚩送通知4J鹏曲而瓯而羲j关闭・■报名林任・实例的CPU使用率M报(图:新建警报)如果警报类型选择的是任意实例、任意主机,则无需其他操作,警报自动对所有实例、主机(包括后续新建的)生效。如果不是针对任意资源的警报,则还需要创建监控项,选择具体需要监控的资源,绑定到相关的警报。绑定警

13、报鳖报名称:弹性组的LPL1使用率宝报-]创建斐报不用小•:「网,停用事平均值三驮持堵开封科(图:新建监控

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。