多应用系统业务探针应用探究

多应用系统业务探针应用探究

ID:5606920

大小:30.50 KB

页数:9页

时间:2017-12-19

多应用系统业务探针应用探究_第1页
多应用系统业务探针应用探究_第2页
多应用系统业务探针应用探究_第3页
多应用系统业务探针应用探究_第4页
多应用系统业务探针应用探究_第5页
资源描述:

《多应用系统业务探针应用探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多应用系统业务探针应用探究  摘要:在网络和业务管理系统中最常用到的探针多是基于端口扫描技术的探针。通过程序后台模拟用户对业务系统的真实操作,分析了业务系统的响应时间和返回内容,从而预知业务系统是否正常使用。如果业务系统不可用或者响应时间过长,仿真探测程序就会自动产生告警,通过告警对用户或网管人员进行提示。关键词:探针;业务系统;健康度中图分类号:TP303文献标识码:A文章编号:1672-7800(2014)003-0049-030引言在一个企业中,通常有针对网络和应用系统进行检测的需求。而现有的检测程

2、序一般都是针对网路端口进行的,以设备监控为主,这种方式只能监控支撑业务系统运行的设备状态,并以此判断系统是否可用。这种方式存在一定的弊端,实际工作中经常出现基础设施各项指标完好,但业务系统应用出现故障或无法响应的情况。同时,业务运营情况缺乏有效的分析指标,这主要是因为业务层层嵌套、互相关联,同时受制于基础设施的稳定性,运维人员很难具体衡量出业务运营是否健康,更谈不上有效发现业务运行的潜在威胁。9本文采用在业务系统和用户终端中植入探针的方式,通过探针提取业务应用指标信息,通过基础设施和应用联合指标建模,可以

3、实现业务的整体式监控。设立了业务健康度模型,通过对父子业务间关系、业务与基础设施和后台资源间关系的结构化梳理,通过对多维度数据的采集计算,能够有效量化业务健康度指标。运维监控系统可自动实时对各业务进行健康度评分,实现对业务运营情况的科学度量,特别适合决策管理层人员了解业务整体运营情况。1系统功能业务健康度和可用性的建模涵盖业务系统几乎所有的管理资源要素,包括业务单元、应用功能、系统服务和其它平台类资源,这些信息都要建立并实时更新于企业集中配置的管理数据库(CMDB)之中。基于CMDB动态调整实时CI项以及

4、CI关系,通过结构化的模型框架,建立完整的业务CI项KPI指标体系,并绘制以业务为中心的系统地图。指标体系的建立要以业务为主线,按照业务——应用——平台的分层结构,针对每一层设定指标分类标准,并在这些指标基础上通过关系推导和加权计算实现业务监控的量化模型。9业务流程探针要能够直接模拟用户在系统中的业务操作,采集应用系统各功能模块的可用状态。其定时采集到的数据能够真实反映用户的操作体验,以及业务在后台各处理环节的性能。通过部署在用户终端模拟点的探针,可以很好地监控到这些模拟点的实际体验数据,实现业务流程操作

5、全时段和全流程的横向全监控。业务数据探针要从业务系统连接的网络交换设备中全程采集业务操作记录,第一时间采集到业务运营状态。利用旁路的业务系统数据包,经过业务包构造,对业务操作的量、时长、数据细节进行统计。同时,按照客户端IP、登录用户名等多维度对最终用户进行分类,及时监控区域性业务操作异常,保障业务支撑的正常运行,实现对业务流程操作在全地域、全用户的纵向监控。2系统实现系统面向分布式应用实现,系统硬件环境根据网络和业务系统的规模来设定,业务探针介于业务系统和终端之间,所有终端对于业务数据的访问都必须经过探

6、针服务器,终端必须安装插件,便于探针服务器进行检测。整个系统架构如图1所示。2.1监控监控网站管理主要是对该系统的所有监控项目和监控点进行维护和管理。应用管理是对该系统所有的监控项目进行维护,包括监控项目的创建、修改、删除等功能。应用管理模块显示了所有监控项目的信息,包括应用名称、访问地址、发生的故障次数以及平均响应时间。9监控点管理是对该系统所有的监控点进行维护,包括监控点的创建、修改、删除等功能。监控点管理模块显示了所有监测点的信息,包括监测点编号、监测点名称、监测点IP、备注等信息。网站监控分析主要

7、是对各监控项目及相应的监控点进行可用率、响应时间等的分析与统计,生成各种统计报表,直观地展示分析结果。对网站监控来说,可用率包括两部分,一个是各个监测点的可用率,另一个是平均可用率,可用率的计算公式为:平均可用率不是监测点可用率的平均值,是独立计算的,当所有监测点访问目标网站失败时,即认为网站出现了故障,用(总时间-故障时间)/总时间可以算出整体的可用率。此处的可用率统计默认为该监控项目在当天的平均可用率,并按小时绘制了该监控项目在当天的可用率变化曲线;故障时间统计默认为对该监控项目当日的所有故障信息进行

8、记录,显示了故障开始时间、恢复时间、故障持续时间、故障原因以及故障分类;失败原因统计默认对该监控项目当日的故障信息按故障原因进行分类统计,显示了各种类型故障的发生次数以及百分比,并通过饼状图直观地显示各故障类型所占的百分比。同时,点击每日统计,可以查看该监控项目自监控以来每日的监控信息,详情可查看每日统计模块。9对网站监控来说,会关注最小响应时间、最大响应时间和平均响应时间,并希望了解构成响应时间的4个环节(DNS域名解析、建

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。