柯亮:各位来宾、各位嘉宾,很高兴有这样的机会能够把宝信软件的20多年来积累的IT运维服务管理的经验跟大家分享。
讲到基于ITLI的最佳实践,不得不说到宝信的文化组织、流程以及工具ITLI的四大要素。宝信的文化,在座的各位对上海宝信软件的了解不是太多。
讲到宝信企业的文化就不得不谈到公司的历史沿革。宝信在79年的时候是宝山钢铁总厂自动化部,94年成立了上海宝利计算机集成技术有限公司,95年成立了上海宝康电子技术有限公司,这四家公司在2001年上市公司上市之后成立了上海宝信软件股份有限公司,随后宝信公司也是在大踏步地迈进,在01年和02年收购了子公司,02年也成立了宝信软件全资子公司日本宝信株式会社,2003年与第一软件有限公司共同发起成立上海仁维软件有限公司,2006年我们收购上海梅山工业民用工程设计研究院有限公司。
谈到公司的文化,我们想介绍一下公司董事会的结构,宝钢集团排出董事1人,也决定了宝信软件是国企的文化,宝信也是派出1人,独立董事3人,公司内部董事4人,这样就造成了宝信公司文化是一个混合的文化,具有传统的国企的文化的反应,同时也有基于上市公司、市场竞争、游戏规则这样一种人员的优势。
我们公司的发展目标是力争成为国内三个一流,第一是信息化服务外包供应商,今天谈到的IT运维和运维服务管理。第二个是国内一流的自动化与职能化的系统集成商及产品供应商;第三个是国内一流的行业信息化解决方案及产品供应商。今天要谈的是成为国内一流的外包供应商。
宝信IT服务是提供满足客户需求的持续可靠的专业IT服务,这是我们的管理体系方针。怎么样实现这套方针,首先是满足客户需求,像联想提到的我们要有一个菜单,提供给客户,让客户进行挑选,这个菜单是共性化的东西。毕竟市场客户的需求是千变万化的,我们怎么样从共性的服务菜单当中,能够演变出一些针对客户具体需求的定制化菜单。这也是宝信在不断积累和思考的问题。
第二个是持续可靠的,要实现这个持续可靠,有多方面的因素。
第一个我们宝信认为,公司管理体系的标准,所以从06、07年开始陆续引入了ITLI的服务理念,并且在07年的时候通过了ISO20000的国际认证。在这样的保证体系之下,实现我们能够提供持续可靠的服务。
第二个因素是我们的人员,大家都知道铁打的营盘流水的兵,人是最重要的因素。宝信的文化是混合的文化,我们的员工是有3500多名,硕士有500多人,这样稳定的团队来支撑我们能够为客户提供持续可靠的一个IT服务。我们怎么样保证我们的人员的稳定性,这个目前来说也是各个企业、研讨商提供的问题,这不是机械化的东西,我说好了之后,喂饱了之后就能稳定地工作,他还有精神上的需求。所以站在企业文化的角度来说,我更多地是要考虑员工更多的人性关怀以及其他相应的一些可能像钢铁行业国企传统的文化思想。通过保留一些传统的人文精神,再结合我们现代人类资源管理上的精华、要素来保证我们服务团队的人员稳定性。
第三个是专业的,怎么样称之为专业?可能从一般的企业来理解看,专业是我的人员够专业、技术够专业,我的人员有很多各种各样的专业技能。比如说我有各类原厂商的技术认证,服务管理的体系认证,通过这些证书来保证我们的人员专业性。但是怎么从理论到实践,举个例子,我们宝信有300多人机房值班一线人员,他们本身学历不是很高,可能是一些中专大专的文凭。第二个也没有太多的专业技能,也许就是自己自学兴趣爱好了解了一些专业知识,我们能不能称他们是专业的IT人员。在我们宝信看来,这样一支团队也是能够提供这种专业化的IT服务的。为什么这么说,因为我们是有一个非常完善的服务管理体系来保证,虽然他们没有更多地专业知识的能力,没有很高的学历,但是他们的责任心、服务意识是一流的,正是这样企业的文化才保证了宝信这种企业为国内最大的钢铁企业宝钢提供服务。
宝信管理体系的服务范围是这样定义的,我们向客户提供包括主机系统、网络系统、信息安全系统、应用系统、桌面系统、机房基础设施、以及工控系统的IT运行维护服务。从IT管理体系当中可以看出来我们的菜单是什么样的,目前来说,我们的服务菜单当中,大家知道菜单当中最重要的是我们要提供哪些内容。
第一个是首先包括了范围,针对各类的IT系统,我们提供四类维护方式,第一个大家最关心的是故障服务。故障服务是用户最关心的服务,一旦发生故障之后,怎样快速恢复故障。第二个是预防性的服务,实际上是背后的服务。作为终端用户来说感受不到。预防维护的主要功能是通过人员的定期或者是周期性地对我所有的基础设施的预防性的检查等等,尽量把灾难故障事前控制在一定的比例当中,避免一些常见性的事件发生。第三种服务我们有适应性地调整服务,我们的服务不是一成不变的,我们的业务在不断地变化,针对这种不断变化的业务需求,必然会带来一些适应性的调整,比如说CPU的增加、内存的增加等等。我们这类服务称之为适应性地调整服务。最后一类是改善性的服务,大家最看重这类服务。为什么?因为从传统的IT服务来讲,我发生了一起故障,我到用户的现场把故障处理好之后,我可能留下一些故障处理的记录单、怎么处理的故障信息等等,作为一般用户来讲,放在几年前,十几年前用户觉得这样的服务非常到位,所有的记录是完善的。但是放在现在,我们用户的能力也是越来越高了,他要知道我的故障怎么会发生,故障发生的时候可以怎么样避免。他要了解综合分析、评估之后的建议,之后就是我们归纳为宝信的总结维护。这些总结是我们跟客户进行协商,比如我们月度、周度、季度的形式,把我们用户在业务管理当中发生了问题,双方进行了一个交流、沟通,提出我们宝信的改善性的一种建议,让用户了解到系统存在的不足。
讲完ITLI第一个文化要求之后,第二个要素组织这块。目前来说,我们宝信经过了20几年的运维的积累,我们目前是形成了这样的一个资产体系。对于运维服务项目来说,我们的服务台和我们一线的工程师是冲在最前面的,他们是很敬业和有责任心的。这样一支团队成为我们组织资产体系的最前线,他们服务处理大部分的IT事件,包括故障、咨询或者是其他咨询之外的事件。对于这些事件进行过滤、分派之后到了我们二线的技术支持。我们的二线技术人员通常在各个专业领域例如主机领域或者是操作系统、数据库、信息安全等各方面的专业技术人才,他们也具备很多认证的证书或者是专业的技能。我们大部分的问题是通过二线技术支持进行解决。
当二线不能够完全解决这些问题的时候,我们上升到三线的技术专家层面。这里面讲到三线的技术专家是从二线的技术支持当中积累经验,逐步成长起来的。当三线的问题,大家也都知道原厂商这块有一些固有的产品的缺陷或者是Bug,光靠我们宝信是不可能解决的,我们通过跟原厂商的保持良好的合作战略的关系,通过原厂商的技术支持来解决我们和客户的问题。这是我们宝信的四级支持体系。
我特意把这张图放在这里,这张图上可以跟我们前面四级支撑体系有一个关联。这张图是公司的一个组织架构图,我们看其中灰色的这块,也就是说从右往左数的第二排。这块我们大部分一线、二线、三线人员分布在我们的各个事业部当中。可以看到其中最重要的是我们系统服务事业部,从公司战略来说,系统服务事业部是作为公司IT统一运维的管理窗口。包括系统服务部的所有人员是IT部门的提供部门,包含了服务台、一线、二线和三线。在其他的事业部当中,每个事业部负责各自不同的市场分工。在他们所承担的服务项目当中,必然会涉及到服务的运维项目。对于其他事业部运维服务的项目怎么开展,这个是由系统服务事业部的人员来支撑。其他服务人员是我们这类市场的其他二线、三线的支持。
我们这套管理体系,通过SOM的服务管理,我们把这套管理思想覆盖到其他的事业部。通过我们的牵头事业部跟其他各个系统部门来签订OMA的协议,来保证公司在整个公司IT运维管理上是一个一体化的服务理念。
另外公司在除了上海总部之外在北京、南京、成都、重庆、广州等等有分公司,包括宝信的株式会社办事处。目前宝信是在上海总部通过了ISO20000的认证,我们紧锣密鼓地将ISO20000的管理标准逐渐延伸到我们的分公司去。
通过这样的组织体系保障,也保证了我们基于ITLI的最佳实现能够确认可靠地运行下去。
这两个图主要是基于ITLI和ISO20000的13个过程管理的流程关系图,为什么说这把个教科书上的图变化了之后放在这个地方,我也是考虑宝信怎么样把13个管理流程有机地结合在一起的。中间红色的这三个流程一次是我们的服务级别管理、中间是服务报告管理,下面是我们服务配置管理。上面是服务交付的一个流程以及服务关系的流程,都在上面这部分体现出来。它的核心是SOA,也就是中间SOM的管理。他们通过了服务报告的机制和我们下面的服务机制这样一块流程组进行了一个结合。
服务支持这块的核心是中间红色的这块叫做配置管理,配置管理我们都知道,是服务支持管理的核心,通过这个核心,我们展开事件管理,从左往有是事件管理、问题管理、变更管理和发布管理。可以这样说,服务支持管理是目前大部分的IT服务管理公司,对服务管理这部分通过工具和手段把服务支持管理能够完善地扭转起来。
最近宝信的管理流程结合ISO20000的流程组,我们目前的支撑是这样的情况。对于上面的流程组我们通过了管理的体系进行支撑的。讲到这里,也说明了我们宝信公司在目前来说,工具支撑这块相对服务交付这部分是薄弱的,这也是我们努力要完善的地方。我们目前提供一个自动化的工具支撑的服务过程管理组,就是我们的服务支持这个图。
宝信通过了自主开发的叫做集中运维管理平台的工具,把我们的事件、问题、变更、发布以及CDM配置管理库有机地结合在一起。展开来讲,后面有一个详细地介绍。首先先看一下截图,这是我们集中运维管理平台,在左边红色的圈圈当中有我们的事件管理、问题管理、变更管理、配置管理,这里面要提到发布管理,我们是和变更管理结合在了一起。变更和发布是在同一个管理当中实现。我们还有一个知识库的管理,通过这样的管理平台,把我们支持过程组里的5个过程关系组合在了一起。也使得我们对于故障响应、事件处理的速度有了极大地提高。这个速度提高,不单纯是把我们从以前的被动式的消防救火员,这也许也是大多IT运维服务管理公司目前所面临的一个挑战。这个挑战原来我们是被动式的,没有先进的理念支撑,很多资源的处理是靠人、资源的投入进行响应的处理。
现在ITLI里面的管理资源体系当中,把事件问题变更发布,以及配置有机地结合在一起。不光是我们把以前低效率的被动的消防救火员似的变成了主动的消防救火队员。我们应该提升到有机地处理我们用户的一个事件,这些问题。而且是站在业务管理的高度去处理,而不局限于这个事件的本身故障处理的一个过程。
另外,我们在集中运维服务管理平台当中,大家可以看到下面的框,这个有一些标签,这是我们宝信自己比较有特色的服务内容。基本上可以看到,我们在运维这样服务的全生命周期当中,我们有非常多的这样的方法论。第一个标签是叫做运维调研阶段的相关文档,第二个是项目策划、启动,以及后面的项目计划、健康检查、故障报告、运维记录以及总结文档、外协管理、运维交接的文档。我们通过这样的服务管理平台当中提供了这样的内容,把我们在整个IT服务当中全生命周期的一些过程统一在了管理平台当中,把所有相关的知识库进行了共享,这也是极大地提高了我们人员的技术能力,以及对于项目的理解能力。
我们还有一个工具是集中监控平台,大家都知道以前没有这种远程的集中监控的工具之下,我们大部分的机房基础设施以及IT传统设备的一些信息的了解都是通过人去进行一个及时地监控,通过点检、周期性地检查发行一些问题。通过这种集中监控平台之后,可以自动地发现一些问题,这样的话,极大地提高了运维服务的效率。
另外我们还有一个备件管理平台,通过这个管理平台,对我们的备件也是进行了合理地管理,包括出入库等等。大家都知道,因为宝钢的信息化建设比较早,它的相关的IT设备也是种类繁多,数量也是非常庞大,所以我们的备件中心当中的一些备件数量是非常大的。通过这样的备件管理平台,能够使我们迅速地检索到我们的备件信息,及时地为故障的恢复提供备机或者是备件。
接下来简要地介绍一下我们三全服务的理念。主持人也谈到了我们是国内最大规模钢铁企业二十多年的IT运维经验,引入了ITLI的理念,为我们用户提供“全生命周期、全流程、全层次”的三全服务的IT运维服务理念,确保客户IT系统持续稳定地运行,为客户提供专业的服务。
全生命周期,我们可以看到举一个运维服务的例子。我们现在有一个运维的Case,首先我们要去咨询和调研,进行咨询和调研。我们要了解我们的客户需求到底要什么,我们怎么去进行了解,首先我们把我们的菜单拿出来提供给客户。因为我们的客户是说不清他们的需求的,怎么样引导我们的客户理解他们自己的需求呢?我们通过我们一个共性的服务性的菜单来让用户进行选择。再进行进一步的调研之后,提供一些定制化的客户服务的需求,之后形成我们的服务级别协议。
在具体进入实施维护阶段之后,我们要提供一些具体维护的手段,也是我们前面讲到的四类维护,通过这样循环的调研。从调研到购建、运行维护、更新改善不断完善使我们的客户的IT系统能够更加稳定地进行。结合我们的服务交付来讲,前面的全生命周期是怎么样实现我们的服务交付的。通过和SOA签订的协议,来实现我们服务级别管理、服务报告的能力管理,通过一些运维的设计,来满足客户业务在连续性和可用性的管理需求。通过和客户总体成本的沟通来制定预算和财务上面的管理以及其他的信息安全上面的管理。
从这样全生命周期的理念来说,把我们ITLI服务交付的过程管理组全部体现在过程当中了。对于全流程服务来说,可以看到,这样的图是基于我们集中运维平台的集中展现,时间关系不具体讲。这个图当中反应出我们的服务台、一线、二线、三线、四线之间是怎么样进行紧密合作的。
通过我们的集中运维管理平台,把我们服务支持这些管理过程有机地结合在一起。
三全服务最后一个是全程之服,我们提供各类的服务内容,像生产控制计算机系统、系统自动化等等。宝信提出了个性化的IT运维服务,第一个是提供IT运维咨询服务,这些是针对一些大的客户,可能有自己的信息化管理部门,但是缺乏对ITLI的了解,缺乏对ISO20000标准的理解。在我们运维咨询这样的帮助之下,帮助他们实现运维有效地方案的设计。
第二类是我们具体的IT运维服务,我们都是一个叫7×24的全包的服务,我们提供一线、二线、三线、四线的人员。
第三类是我们IT技术支持服务,我们是拥有自己的一线人员的。我们二线、三线人员通过对他们的指导,来为他们提供技术支持服务。
最后一类是宝信比较有特色叫做专业维护服务,这是传统的IT服务公司不太具备的。我们可以提供一些设备或者是部件的维修服务。
公司的资质和荣誉不多讲了,我们的主要客户有宝钢股份、包钢等等。合作伙伴有微软、华为、思科等等这边带过了。
最后,我也希望宝信软件能够和我们的战略合作伙伴一起为我们的客户提供更好的基于ITLI理念的最佳实践的IT运维和管理服务,谢谢大家。 |