华为让运维从爬烟囱到喝咖啡观点
的IT系统里做运维,IT建设和IT运维其实是同一个问题的两个方面,此前我在《华为让运维。
文|吴俊宇
2012年,美国科技媒体ZDNET刊载过一篇名为《Why the smart engineer is a lazy engineer》(《为什么聪明的工程师是懒惰的工程师》)的文章。
这篇文章提到说,懒惰的工程与横向思维有许多共同之处。
如果一个问题看起来很难解决或者太复杂,那么可以从另一个更容易的角度来处理它。作为一个工程师或设计师,为你做些简单的事情通常会使产品更容易使用和销售。
是的,“懒”(lazy)并不等于“怠惰”(sloth)。
一个怠惰的工程师,最喜欢的事大概就是无所事事的呆坐着,甚至尽量逃避工作。但真正聪明的工程师会用最有效率的方式赶快把事情做好。
在华为中国企业运维峰会2019上,华为EBG中国区专业服务部部长王辉提到了一个案例:
华为EBG中国区专业服务部部长王辉
华为在全球有超过200个数据中心,30多万台服务器在支撑华为的业务。经过30年的发展,现在30多个人喝着咖啡就可以把200多个数据中心运营做了。
这种“喝着咖啡”搞运维和“爬烟囱”式的运维,有着天壤之别。
一
“爬烟囱”
此前我在《华为让运维“拔掉烟囱”》一文中提到,过往企业、组织“烟囱式”的IT系统给运维环节造成了无尽的困难。
在IT系统建设阶段,企业各个部门按照自身需要建设了一套封闭的系统,这套系统的数据无法打通共享,完全处于黑洞状态。
所谓“烟囱式”的系统大概就是16个字:各自为政、条块分割、孤岛林立、信息割裂。
实际上,华为EBG中国区运维总监赵建波在华为中国企业运维峰会2019上就提到,某客户2018年7月,反馈业务数据无法上传。
华为EBG中国区运维总监赵建波
造成这个局面的原因主要是三个。第一是缺乏上云的评估,无法对业务部门的资源申请进行评估,第二是对不合理的资源浪费没有回收机制。第三是资源规划与业务发展规划不一致。
这恰恰正是很多“烟囱型” IT系统的普遍问题。
这样的“烟囱式”系统最后也造就了“爬烟囱式”的运维——传统分散式人工运维。
这种运维大多是被动式的手动维护管理,缺少有效的流程管控机制,运维工作总是处于“救火式”状态。事前无准备,事中无跟踪,事后无法追溯,运维经验无法沉淀积累与复用。最终的结果就是运维成本高、效率低。
运维工作人员日常大部分时间和精力都花在处理一些简单重复的问题上。而这些运维工作大多数却对企业业务系统的稳定运行帮助很小。
最终的结果是,同样的问题反复出现、反复犯错、反复解决,企业资源浪费严重。
此前知乎上有过这样一个提问,为什么都说运维工程师做不长久?
一位运维工程师在问题下面的回答是:
随着公司业务发展, IT系统越来越多,已经力不从心了。每天都在添加账户,添加管理配置,跑机房重装系统,管理的机器已经乱成一锅粥了,累还效率低下。
“烟囱式”的IT系统里做运维,每次出现问题之后,工程师就像是“爬烟囱”的工人一样,在一个个“烟囱”之中找问题。
“烟囱”里面流程复杂,问题搜寻的过程漫无目的,要花大量时间才能找到故障,最后运维工作完成后工程师也是灰头土脸。
二
“喝咖啡”
想要喝着咖啡做运维,必须要有“懒人思维”。
所谓懒人思维就是:不做重复而低效的任务,自己懒得做,就让工具做,将重复任务自动化。有利的懒惰能够极大地提高效率,节约时间。
华为让企业在数字化转型过程之中可以“喝着咖啡搞运维”,构建了一体化的全方位可视、智能运维支持管理体系,通过统一运维平台I·MOC,用“平台+AI+生态”,帮助行业客户的运维转型。
此前我就提到说,IT建设和IT运维其实是同一个问题的两个方面。建设就像是“开发”,运维其实是“管理”,建设的摊子铺得太大而且建的太乱,必然会给“管理”造成问题。
如果想要在后期“喝着咖啡搞运维”,在前期建设阶段就应该把IT建设给梳理清楚。
解决数字化转型过程中客户需要的五大核心服务能力,包括咨询、行业解决方案交付以、运维、运营和人才。这也是华为企业服务全新定位的出发点。
在前期顶层设计和建设规划阶段就要实现做到合理建设。
比如说,为客户提供咨询,提升外包等服务,针对客户运维发展不同阶段,可以依次降低数字化转型之后客户运维难度。
新建云平台,完成资源集约化,第二步是业务上云,业务应用跑在统一云平台提高资源应用效率。
新建数据共享平台,把各种源头的数据进行汇集治理,最终完成数据服务化。
这就像是建设一套房子之间,先要找设计师花好草图,找工程师打好地基,找采购师把原材料准备好,把前期建设工作给捋顺了。
在后期设施落地和运维管理阶段则是需要做到体系完整、响应及时。
之所以能实现这个过程,核心在于华为有平台有技术有方案,可以让业务永不中断。
1、从平台的维度看,华为提供的I‧MOC平台采用了前台、中台、后台的开放架构,可以让客户在平台上实现自助服务、轻松运营。
2、从技术的维度看,华为之所以能够帮助客户实现智能化运维,依赖的核心要素是算力、算据、算法的服务化。
3、从方案的维度看,华为可以提供端到端从运维咨询、提升、外包、远程到安全的方案。
这就是IT平台建好后,每次有用户提出问题时需要及时响应,还要有强大的技术平台、完整的解决方案来解决这些问题。
华为等于是通过I‧MOC平台,直接串联起了整个系统,让所有的问题都可以在平台上得到及时解决。
美国软件技术专家艾德·伯内特之前曾如此形容技术的价值:
现在天上有三十一颗卫星在地球上空环绕,不为别的,就为了告诉你便利店怎么走。
技术存在的意义就在于让一切都变得简单。
华为用“平台+AI+生态”做这么多事情,不为了别的,也就是为了让一个个运维工程师解放双手,让“机器”运维“机器”,喝着咖啡就把事情做到最好。
1.TMT观察网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.TMT观察网的原创文章,请转载时务必注明文章作者和"来源:TMT观察网",不尊重原创的行为TMT观察网或将追究责任;
3.作者投稿可能会经TMT观察网编辑修改或补充。