本文共 1340 字,大约阅读时间需要 4 分钟。
今天就发生2起故障,连续受惊。国内外有没有运维天王写的什么书或者资料学习一下啊。我现在这个情况怎么提高了,搞来搞去也是小学生水平。叹息阿,现在估计要从大厂招一个天王级运维,没有80万是拿不下了
后有一资深专家总结的很精辟: 运维工作无非三大块,配管、监控、数据分析。@itnihao 的zabbix 的书、@守住每一天 puppet相关的,已经@argv 的ETL Stack相关的书。 我觉得@梁斌penny 都可以看看。像google的sre book啊,更早之前yahoo的webops book啊,层次虽然更高,落地还是要实在点。当然鸟哥私房菜肯定是基础 不过显然是从运维工程师的技能出发点来说的。而原博的诉求点显然是:让人推荐快速学习的方式,却也是极度无奈之举。而且运维也不是一日练成的。就算大师提供了很好的指导,也终究是拿自己的线上产品练手了,这样显然是得不偿失的。现如今,一个创业公司的产品不稳定,造成的问题是巨大的。比如摩拜单车最近就故障频仍,造成的不良影响其实是非常大的,但是因为整个市场发展是往前走的,倒不会因为一两次的故障而改变这种趋势。但是如果没有这些故障,想必会更好吧。
问题在哪里运维理论上不应该那么依赖于人的技能。但是现实情况是,你必须要有好的运维,才能保证系统更加稳定。而对于一个初创企业,显然陷入了一个困难的处境。如何让一个普通的开发也能搞好的运维呢? 核心是一个 一站式的运维平台
按前面那位大神说的,运维无外乎三大块:然而似乎现在运维界缺乏这么一个分布式系统。导致普通开发无法像在windows操作系统一样,点击点击就可以管理起所有服务器以及各种应用了。
问题解决之道 工具化是王道。然而如何工具化是难点。方向不对,谬以千里。比如运维之前也做过大量的工作,做了各种工具,但是存在我之前在 运维=平台+数据 提到的问题:转载地址:http://txaal.baihongyu.com/