智能运维:从场景中积蓄运维变革的未来
来源: | 作者:同耕股份 | 发布时间: 1787天前 | 3478 次浏览 | 分享到:
数字化时代,IT对企业业务的重要程度与日俱增,是推动机构进行智能运维变革的关键。举例而言,在几年前,很多企业机构会在半夜12点-1点暂停交易进行系统维护,而如今的企业交易必须达到24小时不间断的秒级响应要求。

企业数字化的运维变革

      数字化时代,IT对企业业务的重要程度与日俱增,是推动机构进行智能运维变革的关键。举例而言,在几年前,很多企业机构会在半夜12点-1点暂停交易进行系统维护,而如今的企业交易必须达到24小时不间断的秒级响应要求。这就意味着,IT对于企业而言已经由业务支撑系统转变为业务本身。我们在跟企业行业用户交流的时候,大家谈的都是业务,关注的也是业务。在这样的应用环境下,传统运维针对IT系统或者单独IT平台的监控已经不能满足需求。客户关心的是交易是否成功,用户交易的体验怎么样,所以对运维要求与过去相比有很大的不同。过去,IT从底层设备、操作系统、应用、到业务这几层,运维的关注点在于底层设备的高可用和稳定性,衡量指标是SLA能达到几个9。今天,大家的关注点集中到业务层面,衡量IT对业务影响程度的指标变成了MTTR(Meantime to Recovery,平均故障修复时间),这就需要从业务的视角,实现覆盖所有业务链路的端到端全局监控、管理和分析,把监控的点和面都做完整,还要与业务指标进行关联,这就比传统运维复杂度高很多。

      当前企业运维的另外一个挑战来自于数字化转型的推进。区块链、虚拟化、容器、IoT等新技术的应用,导致IT规模和复杂度呈指数增长。过去,传统运维收到不明原因的告警信息,可以把相关设备一台台关掉,再逐一重启来进行排查,解除故障。但在企业系统如此庞大的今天,这类单纯依靠人工的故障修复方法显然是不可取的。不仅如此,随着IT运行环境越来越复杂,每时每刻产生的IT数据量更加惊人,依靠人工设定告警阈值、分析处理海量告警信息同样不现实。这就需要利用大数据和AI技术的助力,通过模式识别和算法对历史数据进行学习,设置更加有效的动态告警阈值,同时对海量告警信息进行实时压缩、收敛和关联分析,利用根因分析追踪导致事件发生的根本原因,实现告警事件的及时处置,有效降低MTTR。

智能运维的认知和核心技术

      到目前为止,业界针对AIOps(智能运维)的认知尚未统一,有人说AIOps就是算法,有的则认为是自动化运维。AIOps并不是像APM那样的产品,而是一种理念。用AI技术去提升企业机构的运维能力和效率,让它具有更好的智能化,更高效的解决企业业务运行过程中遇到的种种问题。同时,AI是一种可以工程化的实用科技,AIOps就是AI在IT运维领域的落地,通过AI技术的工程化,全面提升现有ITOM、ITSM 和ITOA产品和解决方案能力。

业行业智能运维管控中心

      AIOps(智能运维)核心关键不是算法,很多算法都已经非常成熟而且开源了。但是,客户的应用场景千差万别,需求也各不相同,到底哪种算法用什么样的模式匹配到客户场景中,这才是核心。这是一个‘技术工程化’落地的过程,对于智能运维提供商来说,既要有非常好的算法能力,又要对客户的应用场景有非常好的理解力,还要有工程化落地的能力。这几种能力都具备,才能帮客户解决问题。此外,AIOps需要完整数据。因此,要实现AIOps落地,数据采集能力同样必不可少,只有这样才能通过AI得到有价值的结果。

企业行业智能运维落地的理念和建议

      部署智能运维首先要理解传统运维管理与智能运维的逻辑差异:传统运维管理是依赖流程,依靠工单系统把这些串起来。智能运维是基于数据和智能化分析结果进行运维管理,与传统运维的逻辑完全不一样。

智能运维中台

      与传统运维管理依靠ITSM平台管理所有IT问题不同,智能运维的落地注重场景化,解决的是某一类问题当然,智慧运维的基础仍然是数据,在数据之上构建AI分析能力,在AI之上是各个运维产品模块。这些模块以松耦合的方式组成,可根据用户需求的不同任意组合,提供各种运维景化解决方案能力。最后通过可视化运维监控中心,把IT价值直观呈现在IT和业务部门面前,让管理者和业务运营负责人都能看懂IT。

      IT团队在逐步积累AIOps经验的同时,可以树立起智能运维成功部署的信心。而业务部门可以从一个场景的变化快速看到AIOps价值和成效,自然更愿意配合IT部门的变革,推进业务与IT的融合


本文节选自  新企业世界,文案内容有所修改,如有侵权,请联系删除。


----------------------------------------------------        ------------------------------------------------

      同耕股份是一家中国领先的软件与信息技术服务商,致力于深入行业专属定制打造基于云的企业软件解决方案。同耕股份拥有深厚的行业积累和领先的技术实力,以客户应用价值为中心围绕高端制造业,以自主技术、自主知识产权为本,以核心技术平台衍生各行业应用,为客户提供从智能制造、智能运维、智慧营销、智慧应急等行业端到端全价值链数字化解决方案。经过多年发展,为汽车、国防、应急、航天船舶、环保等多个重要行业领域的客户创造了巨大价值,成为客户稳定、可信赖的合作伙伴。