本案例介绍阳光雨露基于多年技术积累和先进的管理理念,结合客户痛点与需求,通过对ITSS标准规范应用,从过程管理、人员管理、技术管理、资源管理四个维度建立业务管理体系,结合适宜的软件支撑系统,通过实施落地, 提升运维服务效率与质量、降低了成本,助力了客户业务的发展。
关键词:ITSM、 IT服务管理、运维标准化、人员、资源、技术、过程
阳光雨露专注IT服务行业20年,作为IT服务领域的领先者,阳光雨露从承接联想服务开始,20年来一直专注IT服务领域,深耕产品支持服务与IT基础架构服务。在IT基础架构服务中,我们提供涵盖IT运维管理咨询、IT运维管理服务、系统集成及解决方案、IT基础架构的数字化转型等专业化服务,形成了覆盖客户IT全生命周期的一站式服务解决方案。凭借我们丰富的经验积淀、完善高效的服务交付体系,能够帮助政企、医疗、金融、连锁、教育等行业客户提升业务效率,最大化地减轻软硬件故障对业务造成的中断。此次案例客户为一家为全球市场服务的跨国经营集团,是世界领先的物流装备和能源装备供应商,在亚洲、北美、欧洲、澳洲等地区拥有400余家成员企业,客户和销售网络分布在全球100多个国家和地区,员工总数7万多人。信息化水平与快速发展的业务需求间的矛盾日益凸显:员工数量、应用软件的逐年增加,原有的IT运维系统无法随着业务发展进行灵活调整(流程不能自定义、报表自动化、数据分散),扩展难度系数较高,很难实现数据互通,需要对集团运维平台进行整体规划,实现多平台系统一体化运营,满足未来平台便捷扩容。提效降低成本的诉求:业务的快速扩张,网络架构较复杂,各成员企业自建烟筒,IT运维团队自身也面临不断降低成本,提高效率,展现专业素养与价值的要求。阳光在IT运维服务领域有着20年的沉淀,通过引入ITSS标准,不断推动人员、过程、资源和技术等能力要素协同改进,并将之融入阳光雨露自研ITSM系统,将各期项目建设平台数据统一接口、统一存储、统一管理,并满足数据安全要求。推动运维工作成熟度提升,实现了IT在保障业务运行,提升运行效率方面的精准管理与赋能,助力业务增长。阳光雨露通过提供专业综合的运维服务保证案例客户运维服务项目中各项工作正常、有序的进行。通过科学规范的项目管理,合理利用人力资源、专业技术、成熟经验、成熟产品等完成各项运行维护工作,优化客户IT运维模式,提高运维管理整体水平,降低运维风险和成本。- 系统化: 将所有IT软硬件信息汇总至CMDB,通过与ITSM对接,可视化资产信息。
- 标准化: 通过服务目录牵引,将服务请求、事件报障、变更、问题等进行分类,并为其制定各种工单类型以及工作流。
- 可视化:将工单、故障、SLA、各业务板块、供应商考核结果以及其他重要指标通过大屏幕,以合适的颗粒度实时展现给不同的受众,为各方面工作提供决策依据。
本项目实现了阳光雨露统一运维服务工具的落地,应用过程和实施过程中,主要参考ITSS标准应用,包括主要参考ITSS标准应用,包括《信息技术服务 运行维护 第1 部分:通用要求》( GB/T28827.1- 2012)、《信息技术服务 运行维护 第2部分:交付规范》(GB/T 28827.2- 2012)、《信息技术服务 运行维护 第3部分:应急响应规范》(GB/T 28827.3- 2012)、《信息技术服务 运行维护服务能力成熟度模型 》(ITSS.1—2015)、《信息技术服务 运行维护 第4部分:数据中心服务要求》(GB/T 28827.4- 2019)、《信息技术服务 运行维护 第 6 部分:应用系统服务要求》(GB/T 28827.6- 2019) 、《信息技术服务 数据中心服务能力成熟度模型》( GB/T 33136—2016) 、以及《信息技术服务 质量评价指标体系》(GB/T 33850-2017)等。
阳光雨露IT服务在项目交付期间,引入ITSS标准,实现ITSM落地。通过ITSM,率先实现个别子项目的高效管理,进而持续迭代,形成一体化的运维方案。阳光雨露运维服务方案涵盖服务台、业务应用系统支持、数据中心运维、ITSM平台建设、运维流程和知识管理等全方位运维能力。具体内容如下图:以ITSS标准为指导,阳光雨露IT运维团队围绕人员、资源、过程、技术四要素推进一体化运维转型 。


阳光雨露IT运维团队基于ITSS标准,制定了统一的事件、监控、问题、配置、变更和发布等流程,建立了量化评价运维人员技能的指标体系,实现对运维人员的分级分类精细化管理,责任到人;确保流程清晰可视化,运维过程有迹可循,提升整体运维效率除了实施CMDB,存储IT环境的软硬件数据外,阳光雨露运维团队还实施了运维数据湖,制定了监控工具和过程管理工具实现数据、信息共享和交换的规范,将监控平台、资源申请平台采集的信息数据集成至ITSM,通过ITSM平台将所有的数据进行收拢,并对这些数据进行清洗、模型计算和存储,保证了数据报告的及时输出和量化管理,使得我们对任何资源如臂使指,大大提高资源利用率、减少响应时间,提高了用户服务体验。在智能化运维的基础上,阳光雨露实现了对服务请求、事件、监控、问题、配置、变更和发布等过程进行记录,而且尽可能地实现了自动化,例如对监控告警进行自动化记录与处理、展示和整合实施掌握SLA达成情况;做到了实时掌握应用健康情况,提前预警,主动应对故障,避免了传统运维过程中的弊端,变“被动”运维,为“主动”运维。围绕领域、产品、现象,梳理并统一服务目录,明确各级服务目录的属性,通过服务目录明确各团队的职责;依据服务级别协议及公司即定的服务级别标准,统一标准,便于大屏数据晾晒及后续服务、产品的优化。同时,阳光雨露对原有的流程做了进一步优化,对数据进行加工后,实时展现在阳光雨露自研的IT运维大屏幕,确保数据的可视化管理。

(ITSM系统架构)

(IT运维数据大屏)
提高系统可用性:阳光雨露将可能具有单点故障的设备或者系统高可用化,比如堆叠各机房工作区域核心交换机,各无状态中间件通过Keeplived虚拟IP等手段,使得如果有一台宕机另一台可以及时替补,对各服务器重新合理化设计RAID等。提高拓展性:阳光雨露将各重要系统做架构变更,比如容器化改造、云化,以便于压力上升后能及时拓展资源满足生产要求。自动化运维:对常见故障处理、日常工作等,阳光雨露凭丰富的行业经验做总结并脚本化。比如自动删除过期日志,自动转储备份数据,自动生成报告等,进而集合Ansible、Jenkins、Fabric等自动化辅助工具,大大提高运维效率。数据安全:阳光雨露建立敏感数据隐私保护机制,确保数据在采集、传输、存储、处理、共享和使用等各个环节中的信息安全和隐私保护。交付管理方面:阳光雨露进一步优化了原有运维服务交付的模型,实现了对运维交付成本、风险、投资回报和持续改进的有效控制,引入自动化工具对运维服务交付过程进行追踪;服务交付方面:阳光雨露通过能力管理、交付管理、资源管理和过程管理等能力的提升,SLA达成率保持在了99.5%以上(目标值:90%),通过自动工具的运用,7x24 例行监控人力节省1/3。应用可用性方面:同样对比引入前和引入后,阳光雨露通过应急管理和技术管理等能力的提升,可用性再上一个台阶,从98%提升到了99.4%,P1和 P2(优先级最高和次高的故障)比率,从约2.8%下降到了小于1%。客户满意度方面:阳光雨露在对运维服务质量评价体系和人员管理精细强化后,客户满意度从96%上升到了98.5%以上,创造新的突破。阳光雨露通过向客户下属成员企业分批推广总部试点经验,提质增效降本。阳光通过20年在IT服务领域的沉淀,以及为政企、金融、连锁、教育等行业提供IT运维服务的经验累积,我们建议政府加大对ITSS标准化工作的扶持,让更多的企业、政府机构、高校、研究机构、社会团体等参与到ITSS工作的标准化、推广中去,提高ITSS的影响力。同时建议ITSS有针对性推出一些案例,从基本原理中每个环节、要素进行最佳实践的案例性讲解和说明。将ITSS标准的学习和应用门槛降低,让ITSS不仅是具备一定运行维护经验人的使用工具,更是运行维护零基础从业人员的入门指导。