网络运维新思路: 平台化、自动化、智能化

作者:赛特斯资深产品解决方案经理 罗曙晖 责任编辑:卞海川 2017.11.16 14:47 来源:通信世界全媒体

通信世界网消息(CWW)近年来,整个IT世界发生巨大变化,主要体现在4个方面:一是膨胀的数据,整个世界产生的数据正在极速增长;二是互联网的移动化,移动设备正以令人惊讶的速度快速增长和普及;三是计算系统的云化,计算机和数据已经从原来的存储模式搬迁、转移到两个端点—云和移动终端;四是社交媒体应用,企业更愿意将成果通过社交媒体传递给受众。

从网络的角度看,现有网络完全没有跟上新的IT运营模式,现阶段的网络在业内被称为传统的网络架构,其架构缜密,通过不同的网络设备商来供应网络设备,他们之间遵循互通性。对于网络管理而言,传统网络架构存在很多的私有网络管理工具,甚至网络供应商提供的应用程序接口也属于私有协议,这种情况对于拥有几十台、几百台甚至上千台设备的企业来说,其维护难度无疑是巨大的。此外,当企业需要推出新应用时,这种旧有网络架构的上线进度也是困难且缓慢的。

因此,构建一套新型的应用开发和维护一体化模式的需求非常迫切,企业需要从系统运维到系统扩展,再到系统补丁等整个环节,都能实现一体化运维,提高现有工作效率,及时快速地开发新应用,提高传递给用户的速度,以及降低成本。

下一代网络运维技术的发展趋势

下一代网络以SDN/NFV化、云化、智能化为主要趋势。随着网络转型深入,现网已经采用并将更多地采用大量计算机技术,这些技术最适宜采用集约化、精细化的监控维护方式。

网络系统作为一个大规模、复杂、分布式的软硬件系统,其运维受到越来越多的重视,相应的运维体系也逐步丰富,逐渐出现了NetDevOps理念:将研发、测试、运维等流程连接起来。而容器技术更是从底层重构了运维,连接了开发、测试、部署、运行和监控等全流程,进一步推动了运维体系从工具化走向平台化、自动化和智能化方向。

第一,由“面向设备”转向“面向服务”。从以前单纯面向网络、面向网元设备的运行维护管理方式,逐渐向业务实现、业务保证、业务计量以及面向客户的方向发展。

第二,由分散式维护作业走向相对集中式、高度集中式。目前,国内外企业对于网络运维管理的规划、建设都采用高度集中的方式,即“集中监控、集中维护、集中管理”。其主要原因在于可以将分散的技术力量集中到网络管理中心和设备维护中心(也有将网管和维护合设为网管维护中心),由此提高运行维护效率,提高网络运行质量,同时保持数据(包括局数据、软件版本数据、网络资源数据、网络运行质量数据、设备性能数据等)的一致性,从而提高企业的核心竞争力。

第三,由单纯追求网络质量(QoS)转向注重用户感知(QoE)的网络。

第四,从粗放式管理转向集约化、精细化管理。

下一代网络运维技术和理念体系

如图所示,DevOps的理念为开发和运维以及QA应该是一体的,DevOps就是三者的交集。

1.png

Networking + DevOps = NetDevOps

网络和DevOps之间的需求是相互的,网络最注重的是正常运行时间,而DevOps的最终目标是持续交付。因此二者的相辅相成变得至关重要,DevOps需要网络来保障更新的可交付性,采用NetDevOps可以促进网络应用与DevOps同样的规则和逻辑,实现可复制和自动化的任务。

微服务

微服务是近几年提出的概念,它通过将应用解耦成多个服务的方式来改善其模块化程度,使其更容易被理解、开发、测试和部署,更适用于小团队快速迭代式协作开发。同时,每个服务也能够采用不同的技术,便于持续进化。最近,微服务配置管理、容器化部署、自动化测试、微服务治理、微服务监控、安全、故障容忍等领域也受到越来越多的关注。

容器优化与实践

过去几年间,以 Docker 为核心的容器技术在持续进化,以其构建、分发和部署的简易性成为 IT 基础架构中的关键技术。容器技术通过标准化运行环境的方式来连接了应用的研发、测试和运维。它简单、轻量,具备很强的可移植性,能更高效地利用资源,还能够有效地解决软件依赖问题,提高研发效率,降低研发成本,因此产业界也持续通过容器来优化其软件发布流程,对已有应用进行容器化。

未来,在容器标准化、容器安全、容器网络、容器存储特别是对数据库等有状态服务的支持等方面还存在很大的改进空间,容器的可管理性及易用性也需要进一步提升。

容器编排与管理

随着Docker等容器技术的广泛应用,容器编排和管理也受到了越来越多的关注,涌现出了诸于 Kubernetes、Apache Mesos、Docker Swarm Mode 等优秀的开源生态和解决方案。它们试图将目前以资源为中心的管理方式过渡到以应用为中心的管理方式,并且试图对应用的基础构成组件(例如配置、服务、负载均衡等)进行标准化,从而获得更好的可管理性。私有或公有的容器云也越来越多,越来越成熟,用户体验越来越好,从而显著降低迁移成本。

当然,在大规模的实践中,在灰度发布、资源调度、隔离性、运维监控、日志等方面仍有待进一步成熟和标准化,在混和云环境支持、跨云服务迁移、安全性等方面仍然面临着困难和挑战。

自动化运维

随着虚拟化和容器化等技术的出现,运维管理的复杂度和难度大大增加,因此必须通过专业化、标准化和流程化的手段来实现运维的自动化,使其能够对部署、配置、监控、告警等进行一站式处理,实现资源和流程的标准化统一化、应用运行状态可视化管理,提升运维质量,降低运维成本。

智能化运维

随着监控范围的不断扩大,网络系统产生的数据具备多样性、多维性和非结构化等特点。由于同业务数据可能存在相关性,而传统的手动分析处理方式效率低且成本高,随着大数据和人工智能的兴起,越来越多的智能分析算法也应用于运维领域。它们通过分析运维系统本身所拥有和产生的海量数据,在问题定位、流量预测、辅助决策、智能报警和自动故障恢复等方面发挥较大的作用,从而进一步降低运维成本。

运维基础架构

运维基础架构涵盖网络、机器、机房、机架等的管理,涉及基础资源、机架设计和交付、网络架构设计、操作系统、系统软件、环境交付等方向。

运维监控

监控是网络系统运维中保障核心业务稳定可用的重要环节,它涵盖网络、主机、业务、应用、性能等方面,涉及快速的故障通知,精准的故障定位和性能分析诊断等。当前比较流行并且在业界广泛应用开源的监控软件包括Nagios、Cacti、Zabbix、Ganglia等。

随着基础设施变得更加动态,监控不但需要关心单个节点的运行状态,更要关心整个应用的健康状态,全链路追踪等技术出现并得到广泛应用。

运维安全

在网络系统SDN/NFV化的背景下,网络应用逐渐虚拟化,并往云中迁移,传统的边界变得越来越模糊,安全也有了新的发展趋势。过去的安全技术是以防御为主,采用传统防火墙、入侵防御系统等。

现在,除了对传统的安全措施进行加强之外,还会在开发流程中引入威胁建模,自动安全扫描、安全功能性测试等安全实践,从而降低安全风险,缩短安全问题的反馈周期。同时,安全也从事先预防转向为持续检测和快速响应,通过对攻击行为的持续检测,对安全事件进行快速响应,从而大幅降低损失。


发表评论请先登录
...
CWW视点
暂无内容