天天看点

IT 运营架构杂谈【前言】

[ 什么是IT 服务 ?]

OGC官方的ITIL 服务定义:

中文定义:实施和管理 IT 服务,满足业务的需要。IT 服务管理由IT 服务提供方通过人员、流程和信息技术的适当组合而进行。

[ 什么是IT运营 ?]

什么是IT运营管理?

IT 运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。

IT 运维管理主要包括七个方面的管理内容:

·设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理;

·应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web 等的监控与管理;

·数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

·业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators);

·目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

·资源资产管理:管理企业中各 IT 系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

·信息安全管理:目前信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127 种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

·日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。

IT运营从根本上来说就是干两件事情:一件事情是保障系统可用(系统可用是指功能和功效两方面都要可用),另外一件事情是系统不可用时能够在第一时间反应和修复。围绕这两件事情,IT运营是通过一系列流程来保证的,这些流程又可以分为三个阶段:

  • 首先是IT部与用户和客户约定的级别提供和管理IT服务;
  • 其次就是IT部在日常生产中协调和执行既定的活动和流程;
  • 第三就是对这些流程的日常管理。

我们在实际运营中,往往会关注前两个阶段,但对其中最为关键的日常管理没有得到正确的管控,即便流程设计和实施再周密也不会有价值。而IT运营日常管理就是对IT系统地进行性能监控、指标评估和数据收集这些活动,通过分析来改进服务。

干好这三件事情,IT运营则要关注“PPT”三要素:

  • 人员(People)——无论管理什么服务、流程和技术,它们都与人有关。是人推动了组织对服务和产品的需求,是人决定了如何完成这项任务。最终,是人管理技术、流程和服努。没有认识到这点会导致(并且已经导致)IT运营管理的失败;
  • 服务管理流程(Process)——在ITIL V2中,OGC设计了5个服务支持流程和5个服务交付流程,在ITIL V3中则更强调从服务生命周期的角度来设计服务流程,但不管怎样,流程从本质上就是制度的固化,采用技术手段将其规范化和标准化,通过事先告知怎么做事从而减少低级错误的发生,但事实上,流程的规范执行却很不容易,往往会被一些人轻易打破,坚持流程;
  • 技术(Technology)——通过技术为IT运营中涉及的服务提供高效运行,除此之外,技术手段还可以为服务本身运行的结果提供性能监控和评估,从而改进服务。从狭义上讲技术主要是提供服务的基础设施管理,从广义上讲技术是包含业务能力在内的系统功能和功效的总和。

[如何运营IT]

围绕着如下ITIL运营管理策略 我们可以开展IT运维:

·IT运营管理基本原则:应作为企业集团IT运营管理体系的基本指南;

·IT运营管理策略:用于确定企业集团各种IT活动间关系的基本原则和出发点;

·IT运营管理组织:明确企业集团各项信息技术活动的授权和责任;

·IT运营管理流程:明确信息技术活动的程序以保障高效的运作;

·IT运营资源和技能管理:提供企业IT管理运作所需要的技能资源;

·IT运营体系的运行与维护:保障企业IT运营体系服务的成本效率和操作性。

在企业内部IT 运营的过程中,我们通常要为ITIL制定一些规范。

知识库的建设一直是自己心中的痛,原因很简单:找不到合适的办法建立知识库的知识体系。

从一开始,自己就发现,如果使用单纯的目录结构来保存文档/知识,必然会出现目录交叉的情况,比如一篇设备组写得关于某某系统主机的故障报告,可能又涉及到对该系统应用改造的建议内容,该如何归类呢? 借鉴淘宝商品标签的功能我们可以为 IT知识库建设一些规范;

[ 如何为IT知识库分类]

结合上述思路,我们的知识库也应该采取自然分类和知识标签相结合的方式来构造。

书中谈到淘宝最初的属性数据,尤其是数码类,来自于“中关村在线”,我们只能自己总结创造了,初步构思是自然分类是按照知识产生的原始类型进行划分,如:

按源头划分:

  • 培训文档:是由于培训所产生的知识,可能是部门自己内部培训的、也可能是参加外部培训得到的
  • 维护操作手册:是针对某个系统、平台的维护操作文档,必须是有详细的操作内容的
  • 问题总结报告:是解决某个问题产生的报告
  • 工程建设文档:是工程建设产生的文档,而且由于知识库本身的要求,不应该是过程文档
  • 会议材料:会议下发的文件
  • 业务通知:相关部门的通知,
  • 其他:暂时没有办法区分的。

按文档内容划分:

知识标签其实是文档涉及内容的分类标签,而且因为标签会比较多,要考虑引入标签组的概念:

  • 平台类别:主机设备、网络设备、存储设备、数据库、中间件、操作系统、……
  • 专业类别:OSS、BSS-CRM、BSS-BILL、ITM、EDA、IT规划、……
  • 系统类别:CRM系统、计费系统、资源管理系统、服务开通系统、客服系统、服务保障系统……
  • 应用服务类别:销账应用、权限管理、营业受理、报表、资源管理、信息安全……
  • 厂商类别:IBM、HP、华***、亚***、中***、科***……
  • 科室小组类别:IT服务台、计费室报表组、维护室接口组、统计室……

但还需要关注问题:各种属性又该如何维护呢?肯定不能谁都可以增加的,这已经是管理问题而非技术问题了。

按文档负责团队划分:

  • Infra: Tele.System, Domain , Web Security, MPLS, EVPN, File Server, Citrix, VPN, HelpDesk , Internet Service, Cloud Storage , PC , Printer 、etc
  • Application: CAX Licnese, OA Licnese , Mail Licnese, Mobile Goods ,
  • Business: ERP license, ERP Service , SAP HelpDesk, Solution Manager, PLM ,CRM , SRM license, SAP+ System,

按IT服务内容划分:

  • IT Operation : 比如日常运营维护,日常issue review等
  • IT Project : 比如新公司建设,系统集成,新系统实施,新项目roll-out ,

[ 如何由传统IT运维转变为人性化的IT服务水平]

传统的运维工作的重点往往是各种技术管理工作,如机房管理、服务器管理、网络管理和系统软件管理等,但这些都是面向信息系统的,也就是说,运维工作的对象是信息系统,运维管理也是围绕如何保障信息系统有效稳定的运行这一核心目标。因此,我们的运维人员所关心的是系统。

而用户并不关心系统,他们不关心这些设备的运行状态,或是出现了什么故障以及故障原因,他们所关心的是这些设备、系统所支撑的业务是否能够满足顺利完成工作的需要,这实际上就体现出双方在对待同一事物(运行服务)上关注点的距离,做好技术管理仅仅是必要条件,而IT服务管理像一个双面胶将IT与业务粘合起来,弥合了双方在认知上的这个距离。

在IT服务提供商的眼中,很多具体的运维工作是可以通过第三方分包来完成的,尽管对于系统的运维是一个基础工作,但不是ITSM的核心。

ITSM通过过程管理规范IT服务的活动,使得服务定义客户化,职责清晰化,流程标准化,交付可量化,手段科学化,从而持续改进服务水平,不断提升服务质量,充分体现服务价值。

在传统的运维服务中,用户觉得运维工程师就是对他们的一个人员的补充,运维服务正在向着“人力资源外包服务”这个方向在蜕变。在通过ITSM的应用实践之后,形成了一套完整的、具备自我完善、持续改进的、具有内在的自我驱动力的体系,对于运维服务,个人以为完全可以用“重生”来形容。

[ 落地:采用一个系统平台IET来 管理和量化IT服务,并向公司管理层 呈现绩效报表]

客户自助服务门户

服务对象遇到IT故障,可登录客户自助服务门户

(简称CWP)自行提交服务请求或故障申报。

可有效降低服务成本

客户资产配置库

使执行IT服务过程中可清晰了解客户方的IT资产

与配置情况

统一的知识库管理 实现企业知识不断积累的知识库建设体系
待命管理和员工状态管理

了解工程师的忙闲状态和能力水平,

将事件分配给合适的一线工程师

问题管理和投诉管理 建立问题管理流程,消除引起事件的深层次根源
合同管理 记录客户合同的主要信息,以便快速了解合同中的重要信息,包括工作范围、服务内容、服务协议等
IT设备与资产管理

资产信息维护、资产操作、资产折旧、

资产自动发现、供应商信息

变更与发布管理

使用标准的方法和步骤,

有效控制IT环境变更,

以及大范围的IT架构变更

推荐延伸阅读:

1、《ITIL术语和缩写》(中文,v1.1,2011-8-10发布);

2、《IT运营管理——IT与业务的和谐之道》,作者:金红强;

3、《怎样构建企业IT运营管理体系》,作者:姚永存 姚景斌 游香云 李正茂 申华;