2015年第一天,51CTO博主alex曾发表了《普通的运维人员就是秋后的蚂蚱》的博文,为广大的运维界同仁们敲响了警钟。文章主要从资源集中化和高度自动化两个行业大趋势出发,断言普通的运维人员已经走在了被淘汰的路上,IT自动化必将砸掉大多数不思进取的运维人员的饭碗,寿终正寝只是时间问题。
敏捷运营要求BizDevOps一体化
博文中提到的资源集中化,可以理解为云计算。2008年谷歌率先提出了云的概念,它将传统的IT计算能力形成资源池,进行弹性配置并对外提供按需服务,具体表现为服务化和平台化。
我们也要看到,云计算的快速发展,是因为其满足了企业敏捷运营的需求。“互联网+”,强调互联网、云计算、大数据等技术与制造业、金融业等传统行业的结合与发展,就是要通过这些技术快速构建新数字化产品和服务原型,实现企业的敏捷运营。移动互联网的迭代思维,更是将敏捷运营发挥到了极致,团队成员需要在最短时间内上线APP V1.0版本,基于用户反馈以最短的时间再次开发升级,并迅速推出新的升级版本,然后再次收集反馈进行开发,快速迭代。
笔者多次参与广通软件承接的运维及APM项目建设,可以看到这种变化将对IT运维产生深刻影响。Dev和Ops融合将或正在走向Biz、Dev、Ops的全面融合,即业务、开发、运维联合,集开发、测试、部署和运营为一体。Business + Development + Operations = BizDevOps 。与DevOps相比,BizDevOps能更有效地促进开发、测试、运营和运维之间的沟通、协作与整合,加速应用交付、提高应用质量和用户体验,同时大规模的业务应用也需要APM应用性能监测工具来做支撑。
BizDevOps对运维工作提出了更高要求
运维工作也将发生翻天覆地的变化,主要体现在两个方面:运维自动化和业务监控。
首先,我们需要一个大规模集中监控平台,能够对公有云主机、私有云主机、网络基础设施进行集中的大规模监控,并实现高度运维自动化。这有助于将运维人员从简单的运维中释放出来,同时具备类似Facebook一个运维人员管理2万台服务器的能力。
其次,BizDevOps需要从业务视角做出更快的决策与响应,这就要求运维人员更加熟悉业务,而不仅仅是底层的主机。运维人员要掌握业务、特别是关键业务的可用性、健康度,要实时监控应用性能及最终用户的满意度,最终形成量化KPI指标体系,真实衡量IT系统的服务水平,为产品快速迭代与体验改善提供关键数据。
业务系统的多态性将成为以上任务的主要障碍。我们可喜的看到,宝贵的APM工具正在扫除这种障碍。曾经让运维人员头疼的业务系统黑匣子,现在通过APM工具的业务可视化视图即可解决。通过APM工具与行为分析解决方案,曾经无法获悉原因的异常行为,现在可以实时发现、定位、分析问题根源及趋势预测,使BizDevOps团队着眼于部署和测试新的软件、保持敏捷性,运维的工作重点也将从救火转变为预防。
业务监控为我们架起了业务系统和基础监控之间的桥梁。现在我们能够了解业务量与主机计算能力之间的关联关系,并形成趋势预测,这为IT系统自动伸缩创造了条件。在更高级阶段,和云计算的按需服务能力相结合,实现弹性计算。
BizDevOps的技能需求
从以上变化来看,BizDevOps团队的技能需求,主要集中在自动化和业务运维领域。自动化将运维人员从传统手工的劳动力中释放出来,而业务监控将赋予运维人员更多的能力。这两方面的需求将持续增长,企业也急迫需要找到具备以上技能的运维人员。
古语云:“人无远虑,必有近忧”,但博文中引出的不往自动化方向转型即被淘汰的观点不太准确。实际上,运维自动化已经发展很多年了,像SaltStack等开源成熟的工具也都已很成熟。
我们常说“不忘初心”。运维的初心就是业务运维,之前传统的运维很少涉及业务的运维,但随着宝贵的APM工具的逐步发展和完善,如何用好这些工具,使业务运维上一个新台阶,将会是2016年BizDevOps团队重点关注的课题。