如何把握ISO20000的管理轴心
可用性管理是ISO20000的核心应用,也是数据中心工作的重点。事件管理、变更管理、可用性管理、服务级别管理四个管理流程构成了数据中心从用户到客户的管理轴心,使得数据中心的管理有所把握。在这只手的配合下,可用性管理服务起到了主导作用。
金融行业处于一个变化加速、竞争日益激烈的商业环境中。各金融机构都希望通过大的业务集中和数据集中,扩大业务规模,为客户提供更多更好的服务。大规模业务集中和数据集中的实施,使得数据中心在所有金融机构中占据了极其重要的地位。集中式数据中心面临着规模、管理水平、管理手段不对等的问题。数据集中后,如何更好、更高效地管理数据中心,降低管理风险,消除管理盲区,成为金融机构数据中心管理者的重要课题。
新建立的数据中心的管理者在如何有效管理数据中心方面做了很多努力。比如很多机构聘请了国外的专家与同行进行咨询和交流,但都因为环境、文化、管理的困难和挑战不同而失败。即使有的做了非常漂亮的管理方案和文件,也因为离实际环境太远,不能有效付诸实践而束之高阁。于是很多管理者将目光转向ITIL和IT服务管理,将ITIL实践管理方法引入组织,通过设立服务台,逐步先管理事件、问题、配置和变更。随着服务台搭建的数据中心日常故障排查逐渐步入正轨,管理者有时间考虑更重要的问题:如何更有效地管理数据中心,减少停机事故,加强安全生产。
变革管理是最关键的。
对于数据中心来说,一切工作的重中之重就是安全生产。在与多家金融机构数据中心管理层交流的过程中,“安全生产”这个词被提及率高。“安全生产”正是我们在ISO20000所说的可用性管理。换句话说,可用性管理一直是数据中心的核心工作,但它不是空中楼阁,需要其他管理流程来支持。对于数据中心,ISO20000管理系统中的其他管理流程和整个管理系统都是为可用性管理服务的。
可用性管理与容量管理和连续性管理密切相关,它们构成了数据中心管理的核心领域。容量管理的核心是容量规划,要与业务管理形成顺畅的接口,将业务发展信息及时带回数据中心,业务关系经理将业务信息分析、分解、翻译成数据中心工作人员能够理解的业务需求。然后根据业务需求,由能力管理经理转化为下一年各业务部门发展所需的it能力规划;同时,人员的规划也将纳入到这个产能计划中,转化为预算计划、采购计划等。每季度单独审核一次。通过这个过程,数据中心可以从容应对容量问题,解决当前和未来的容量问题,为提高可用性奠定基础。对于金融机构的数据中心来说,最重要的基础工作就是做好变更管理流程。变更管理过程是一个控制的过程,不掌握变更管理过程,很难说掌握了安全生产的主动权。要抓变更管理,首先要抓变更管理控制的流程,让任何不合格的、不合理的、不合时宜的、准备不充分的、未与客户达成共识的、未完成审批程序的变更申请都不能变更。如果这个抓手松了,可能会带来大量的消防工作,甚至造成可用性事故。让我们来看看一个银行数据中心的变革经理一天的工作。数据中心的变更管理由变更经理小组管理。这个小组每天有1 ~ 2名执行变革经理,负责各方的协调、跟踪和监督。每天早上下班后,都会检查ITSM系统,看看是否有新的变更单等待处理。变更经理将与变更申请人沟通,接受或拒绝变更,如果变更被接受,则变更单将被转移到变更接受小组进行规划和设计。当变更接受团队开始处理此变更单时,变更单的状态将更改为“正在计划”。在处理完当天提出的新变更后,变更经理会看一下已经策划了很长时间的变更单,尤其是持续了一个月以上的变更单,会和变更策划人电话沟通,看变更条件是否成熟,有没有需要帮忙协调的工作。对于计划中的变更,他还会检查变更计划,变更时间是否在变更窗口内,是否有回滚计划,是否经过测试等。不合格的寄回重新规划。不同的变更指定不同的变更审批路径,计划变更需要经过变更类型的变更路径上的相关人员审批后才能进行变更。在重大变更的情况下,执行变更经理还将负责协调各方,并敦促所有技术批准人和管理批准人批准。还需要每周发布未来两周的变更计划,让变更相关人员了解变更进度,相关系统人员了解变更信息。变更经理的日常工作可以反映出变更管理的主要控制环节。抓住这些控制环节,就抓住了日常工作中影响生产系统可用性的重要控制点。
因此,许多金融机构将变更管理作为日常管理的重点工作,尤其是变更的审批极为严格。在深交所系统运营部,每一项变更都要经过准备方案、测试方案、各方技术联审、各级领导联审,同时还要征求业务部门意见后才能实施。这个过程看似复杂,但每一步都是必须的,缺少一步都会造成不可挽回的损失。当然,他们有一个有效的IT系统来执行这样的审批流程,这使得审批程序非常顺利。
事件管理作为用户的数据中心管理流程,一般通过服务台接入客户事件,一线或二线工程师帮助用户解决问题。事件管理通常可以在金融机构的数据中心中得到很好的管理和实施。管理方法可能略有不同,但都遵循ITIL提出的赛事管理要求。ISO20000还特别提出,事件管理要加强与安全事件、可用性事件和连续性事件的联动,使系统更加强大。各金融机构服务水平管理的可能形式和内容差异较大,但核心点是定义数据中心服务的客户,所提供服务的内容和服务水平。所有的服务内容和服务水平都有其他管理流程提供的数据基础,尤其是可用性管理流程。同时,系统应定期报告服务情况,并通过服务报告流程对向客户承诺的服务进行汇总报告。
四个过程形成了轴。
事件管理、变更管理、可用性管理和服务级别管理这四个管理流程构成了数据中心从用户到客户的管理轴心。这个轴让数据中心的管理有了一个抓手,可以在这个轴的基础上工作,打通各个流程之间的联系,让基于ISO20000的服务管理体系更强大,更有活力。
数据中心的管理必须具有全局视野。有些失败是没有把全局观考虑进去,要么只考虑技术因素而不考虑管理,要么只考虑流程是否完善而不考虑是否能真正执行,要么完全引入其他企业而不考虑自身特点。作为一个管理系统,ISO20000最强大的地方在于它是一个完整的整体。从管理者的职责、人员要求、文档要求、流程要求等。要求所有数据中心综合考虑,统一规划,然后实施。有经验的咨询公司会在系统建设上给予数据中心有效的帮助。