网易视频云:如何监控 OpenStack.doc

网易视频云:如何监控 OpenStack.doc

ID:49616957

大小:60.94 KB

页数:10页

时间:2020-03-02

网易视频云:如何监控 OpenStack.doc_第1页
网易视频云:如何监控 OpenStack.doc_第2页
网易视频云:如何监控 OpenStack.doc_第3页
网易视频云:如何监控 OpenStack.doc_第4页
网易视频云:如何监控 OpenStack.doc_第5页
资源描述:

《网易视频云:如何监控 OpenStack.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、vcloud.163.com网易视频云:如何监控OpenStack  网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术,为客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PASS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在,网易视频云的技术专家与大家分享一下如何监控OpenStack。  OpenStack是开源IaaS解决方案,组件众多,架构复杂,并且技术栈长。随着系统规模不断扩大,如何快速发现,定位故障,最终处理故障成了一个急需解决的问题。Open

2、Stack的监控分为三方面:监控、报警;诊断、追踪;故障处理;其中监控和报警是发现问题的第一步,解决的主要问题是在大规模部署OpenStack的情况下,如何准确、详尽地报告系统目前情况,及早发现并提示故障发生。  OpenStack的监控可以分为三个层次:操作系统监控,服务监控,端到端监控;层层依赖,服务的稳定依赖操作系统的稳定,而只有服务稳定了,用户才能正常的操作云资源。他们的关系如下图所示:vcloud.163.com  ·端到端的监控着眼于发现影响用户的问题,这类问题优先级很高,但是由于属于最高层,具体产生的原因不很明显,所以需要下面两层的监控发现更细致的问题。·服

3、务监控着重从OpenStack的软件架构,实现原理出发,站在运维人员的视角,判断服务是否正常。·操作系统监控收集操作系统的基本指标,如果操作系统异常,在其上运行的服务软件很难正常工作。在一般大型互联网公司中这一层的监控由SA负责。  选择开源系统  开源监控系统千千万,如zabbix,nagios,Cacti,Munin,icinga,ganglia,collectd+graphite,influxed+grafana,prometheus等等。但是OpenStack的特殊性决定了我们需要一款监控系统:1.监控系统目前状况,在超出预期时报警;2.记录历史信息,比如过去一年

4、的CPU使用情况,内存使用情况,因为运维OpenStack系统的关键是预测和判断系统的承载能力,运维人员需要有历史数据;vcloud.163.com1.图形化,数据可视化是运维OpenStack的关键,运维人员需要在系统还没有达到承载上限的时候预判风险,提前扩容;2.故障响应可扩展:发现问题除了报警,对于能够自动化处理的故障,监控系统能够支持自动化处理;3.报警管理,问题分轻重缓急,轻度的问题可以推迟处理后者不处理,严重的需要立刻报警;开源系统在以上几个方面各有所偏重,使用方法也各不相同,本文主要基于zabbix设计OpenStack的监控系统,不过基本思路可以应用到任何

5、监控系统上。  1.操作系统监控  操作系统是整个OpenStack的基础,选择通用的监控项即可,主要监控如下信息:监控内容磁盘空间使用率磁盘io使用率CPU使用率内存使用率vcloud.163.com网卡使用率每一个OpenStack节点都必须监控操作系统状态。在zabbix中可以设置一个Template_OS_Openstack,所有host都关联到这个template上。  2.服务监控  OpenStack的服务繁杂,架构比较复杂,比较容易出问题的也是这一层。按照实现原理和使用的技术,可以将服务分为3类:基础软件(如haproxy,memcache,mysql等)

6、;API类服务(nova-api,cinder-api,glance-api);RPC类服务(nova-compute,neutron-agent,cinder-volume);按照不同服务设计不同的监控方法。  系统中,不同节点会安装不同的服务,比如控制节点一般会安装API类服务和基础软件,计算节点会安装RPC类服务,但不能排除异常情况,由于突发情况,在计算节点上安装了API类服务临时扩展API性能。所以zabbix中应该对不同的服务设置对应的template。比如安装了nova-compute软件的host应该关联到Template_App_Nova_compute,

7、其中仅包含了nova-compute的监控项。  2.1基础软件软件监控项Haproxy监控各个端口是否正常服务;各个端口连接数;内存占用情况,CPU占用情况;vcloud.163.comMySQL内存占用情况;CPU占用情况;监控端口是否正常连接;Memcache监控11211端口是否正常服务;监控eviction值;Libvirt监控服务是否正常响应请求;open-vswitch监控服务是否存在并且是否正常相应请求;另外也可以使用sflow协议来网络流量。RabbitMQ监控服务是否存在;内存使用情况;磁盘使用情况,连接数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。