本文是数人云深圳技术分享课上优维科技联合创始人彭鲤航的演讲实录,演讲主题是《运维自动化实践》。
精彩观点抢鲜看
实现运维自动化闭环,最主要就是配置管理、状态管理和变更管理能力。
治大国如烹小虾,我们来类比餐厅老板,看如何实现炒菜的自动化:
首先,我要知道我的厨房里到底有些什么东西是可用的,比如备了哪些菜,有那些工具,这些就是配置管理。
此外,我要让系统帮我去做菜,是炒、是炖还是煮?是加水、加油还是加火,这些都是变更管理的能力。
最后,系统还需要能够知道我炒的菜目前是一个什么样的情况,有几分熟,温度有没有太高,油是不是太少什么的。这些就是状态管理的能力。
不管是什么样的自动化系统,实现本质就是这三个能力的闭环。
正文
我结合自己在运维方面的一些工作经验,介绍一下怎么样去设计和建设一套完整的运维系统以便支持分布式架构的系统。
首先简单自我介绍下,本人从事运维相关的工作有很长一段时间了,应该有十几年了吧。
我的第一份工作是做系统集成,期间建过网络、建过机房、爬过天花、搬过服务器,感觉全是各种体育锻炼,锻炼出来的身体正好就是干运维的料子。因为运维首先得有体力搬得起服务器。
印象中我搬过最重的服务器是IBM的RS,应该有个几百斤吧,一个人根本扛不动,四个人搬都非常吃力。我原来身体好的时候能做一百多个俯卧撑,自从不搬服务器了,现在估计30个都做不动了。
我加入了腾讯,腾讯企业文化很好,经常会有很多小组活动、部门活动什么的,但是做运维很苦。经常在外面玩得时候,人刚到电话就过来了。
有一段时间我专门负责值班优化,承包了所有的告警处理,那时候每天晚上要起来四五次处理故障,一个故障最少也要搞个半个多小时到一个小时,当时一直觉得这事只熬过来别的事情就应该都是小菜一碟了。
虽然当我有小孩之后,才发现原来还有比干运维更辛苦的事情的。
都说运维苦,但其实只要干好了,也可以是非常快乐和有成就感的。为了让运维都干得比较快乐。
所以,年的时候我们几个腾讯的同事一同创业,希望把我们的想法和经验能够传递出来。通过推动和帮助各个企业进行运维平台的建设,来解放运维的压力,帮助运维进行转型,并形成运维技术的企业竞争力。
1、运维的趋势与挑战
先说说目前的运维的一些变化。
首先,从运维的职能来看。只要干好一件事就可以,那就是让我们管的机器,或者业务能够一直正常运行,只要它不故障,基本就没有运维的事了。
但如果出了异常,不管什么事都会有我们的责任,这就是运维。
为了做好运维,需要白殿疯病北京的白癜风哪个比较好