探索中国CIO人才现状 | 第四季调研报告
细数各种关键绩效指标KPI
2015-07-21  来源:techtarget

KPI将成为考核IT服务绩效的一个重要因素。KPI包括与业务需求结合的度量,数据中心的监测和能力规划等等指标。

IT服务从传统的注重硬件运行和软件监控转向使用关键绩效指标(KPI)为业务的重点。IT行业的KPI是一个抽象的目标,如用户体验或工作效率。

IT服务的KPI指标与常见的监测指标之间的差异是企业领导的参与。任何一个企业都可以部署一些监控工具来跟踪分配给虚拟机的资源或服务器的带宽利用率等。这些分散的技术因素对IT技术人员有帮助,但对企业的实际应用价值并不大。企业应该了解KPI,利用KPI来管理和解决问题。

KPI可以帮助企业高管表现出管理投资的正确和成功。例如,一些依靠线上销售或者网络交易的web系统的KPI指标就包括应用程序的性能和系统利用效率。还有附加指标测量的IT基础设施,包括交易的状态,效率和灵活性。

虽然ITIL有一套通用的性能建议设置,但它没有一套可以通用于所有项目的需求关键绩效指标。IT的关键绩效指标通常分为三大类:服务交付力、服务或性能的效率和灵活性(应对服务的变化)。企业的IT服务提供商也应该使用服务可用性的KPI指标。

服务交付力

• 服务吞吐量

服务吞吐量体现在用户对应用程序或系统的使用或需求。通常是指事务的数量或计算工作的措施。

•响应时间

响应时间的KPI指标包括需要完成事务的时间长短。响应时间包括多种基础设施元素,如服务器、网络和存储。它与服务级别协议有紧密的关系(SLA)。

• 资源利用率

举个例子,物理或虚拟机的资源与被分配资源总量的比值就是一种利用率。如果一个虚拟机分配了10G的内存,而它使用了10G的内存,利用率便是100%。

•正常运行时间

正常运行时间是衡量应用或系统正常运行时间的百分比指标。群集技术,自动恢复服务器和网络故障转移都有助于正常运行时间的指标。

企业可以利用这些指标来计算其定制服务KPI。例如,如果设备的吞吐量和正常运行时间的指标高而响应时间的指标低,无论资源利用率的高低,服务分数都不会受到很大影响。但如果资源利用率和响应时间增加而吞吐量或者运行时间下降,则会严重影响服务分数。

服务效率和性能

•工作效率还是性能?

这个派生的指标将工作量的分配资源和利用资源拿来做比较。这个指标可以看出工作量对资源需求的大小,是浪费资源、资源不足还是刚刚好。

•系统效率和性能

系统效率是以服务器的分配资源与可用资源对比的一个指标,让服务器能达到最佳的性能负载。从这个指标可以看出服务器是存在资源浪费还是资源超载。

工作负载和系统的指标通常是通过数据中心汇总数据后计算出来的平均值。IT团队通过快速测量工作期间的状态,再比较它以前的状态来为新技术项目的投资提供必要的数据。例如得到一个较低的KPI数据,就表明可能需要升级负载均衡或其他技术项目。

系统敏捷性

•服务请求回应

服务请求回应是指在可接受的时间内回应通过呼叫或者其他方式的服务请求,并成功解决的事件数量。

•服务处理时间Ttr

Ttr是衡量需要解决服务请求的时间。例如当收到一个新虚拟机的请求时,评估的时间,方案的确定,批准到提供一个新的虚拟机这一整套流程的时间;或者收到要进行资源分配更改的请求,所需要的性能检测时间。

伴随着IT服务请求的数量增加,Ttr会相应的下降。可以看出Ttr是灵活的,能够应对变化的工作量和用户需求。如果服务请求和Ttr的数量同时增加,则表明IT服务存在明显的服务敏捷性短板。

服务可用性

IT服务提供商或其他提供受SLA(Service-Level Agreement 服务等级协议)约束的IT服务组织,都可以采用SLA KPI,这是一个涉及范围广泛的指标。

•服务请求处理率

这个KPI指标是度量在一个可接受的时间对服务请求提供可用服务或者帮助的百分比。

•正常运行时间

正常运行时间指标体现在一个计费周期内服务的可用性上。在周期内,也许不可避免有一定量的服务中断,但这个中断时间可以衡量SLA的履约能力和经营业绩。

•平均故障间隔时间(MTBF)/平均修复时间(MTtr)

MTBF和MTtr是指故障频率和修复故障所需要时间的两个指标。

•服务请求数量

这个指标是投诉或服务请求的数量。它的增加表明某些系统或平台存在问题。

收集所有的数据,整合并制定结果提供给业务主管,它是SLA问题的一个重要早期预警。根据这个指标提供的基础数据可以为业务目标改善服务。

KPI指标的疏漏

1.主观指标,如用户满意度等。KPI主要是基于客观特征的应用程序的性能和吞吐量等指标,但KPI总是使用客观的可测量的参数,这会导致主观指标的缺失。

2.业务和IT团队的领导对KPI的看法永远一致的时候。例如,一个企业可能会跟踪统计系统利用率和运行时间。在早期,利用率更为重要,但由于服务的发展和利用率开始达到预期目标,正常运行时间则变得有更大的意义。

3.企业领导人没有根据商业模式的变化更新KPI。例如,一个新建数据中心建设的重点在于能源消耗和成本控制。一旦达到了这些目标,重点应该转变为提高服务质量或灵活性。

选择关键绩效指标衡量IT服务

一个也许最重要但被忽视的方面——KPI是与业务紧密相关的。无论会计、市场营销、销售等等行业,IT服务都可以管理和提供符合行业所需的应用系统和工具的统计报告。但并不是每一个指标都必不可少或可以作为测量目标。从公司到公司,甚至从项目到项目,这些KPI指标的作用并不相同。

选择IT的KPI指标首先要了解这些指标的作用。专注于服务的业务将关注在不同负载条件下的事务或吞吐量相关的测量和活动指标。相反,企业关注控制成本的指标,包括计算资源的可用性指标、利用率和系统功耗。

因此,随着时间推移,根据不同区域选择可测量并建立阈值的机制,实现与监控管理工具测量和选择不同KPI指标是一个成熟IT服务的关键。