微信号:infoqchina

介绍:有内容的技术社区媒体

原来这样做运维,就可以不被 KO丨课程推广

2017-05-07 09:26 StuQ

IT 运维是一个融合多学科(网络、系统、安全、应用架构、存储等)的综合性技术岗位。这也是让很多运维人员常常困惑的原因。怎样才能评判运维工作的好坏?一般来说,可以包括五个维度:效率、稳定、安全、体验和成本。其中效率和稳定是运维最本职的事情;安全、体验和成本是更进一步的方向。

1、效率

主要是指日常运维例行工作的效率:资源分配 & 回收、域名配置、VIP 配置、持续集成 & 发布、应用部署、应用扩容 & 缩容等。通常提到的运维自动化,大多是集中在这些工作上。运维自动化的目标就是解放运维的生产力,提升运维效率,降低人为失误,把运维的能力沉淀到运维的技术平台上。

2、稳定(质量)

可以通过监控、全链路、强弱依赖、限流降级、容量评估、预案平台等措施,让业务运行更稳定。做好这一点,需要有相对独立、专业的监控和稳定性平台来支持。这部分目标是最大程度地保障系统的稳定性和运行质量。即使出现问题,也能够快速发现、快速响应、快速(自动)恢复。

3、安全

如果安全出现问题,会给运维带来沉重的修复成本。包括各类主机安全、DB 安全、Web 安全、应用安全等等,与此相关的还有漏洞、DDos、CC 等。

4、体验

主要是终端用户的访问体验。对于非功能或非产品的使用体验,运维最需要关注的是访问速度。开发团队往往会把注意力放在代码及性能上,忽略端到端全流程的性能和体验。而运维可以站在全局的角度来审视和治理整个端到端的全链路性能情况,给出对应的性能优化建议。

5、成本

即技术 ROI(投入产出比)的问题。当系统规模变大后,掌控在运维手中的资源将占整个研发团队支出的大头。如果没有很好的成本控制意识和策略,对于公司成本会是非常大的负担。运维工作者需要考虑到服务器 CPU 资源利用率的提升(引申出来各种虚拟化、容器或云资源的使用)、IDC&CDN 流量带宽使用的管控,还有人力的投入和成本的管控。

具体地,运维工作人员该如何兼顾这五个维度并达到平衡?自动化运维的整体架构该如何搭建?最流行的 SaltStack(ansible)、Puppet、Zabbix(nagios)有哪些不为人知的技巧?等等…

为了解决运维人员需要关注的这一系列关键的问题,StuQ 工作坊请来金山西山居运维架构师——刘宇老师,他也是《Puppet 实战》作者,曾在新浪、百度担任高级系统工程师,有近 10 年运维工作经验。在《自动化运维实践》里,他将手把手带大家进阶运维之路。

前 20 位报名,享受 7 折早鸟票!抢座点「 阅读原文 」

 
InfoQ 更多文章 Q新闻丨Facebook 开源 JS 代码优化工具 Prepack;GCC 7 如何构建一套高可用的移动消息推送平台? 四五十岁之后,还在编程的程序员都有谁? “从此社区再无 Docker?” 那 “Moby” 又是什么? 今日头条Go建千亿级微服务的实践
猜您喜欢 FUSE Redis中国用户组成立了,约吗? 年终盘点之国内IaaS云个人使用体验报告 赛尔原创 | 顺滑:让语音识别更流畅 程序猿的怒吼 【业问】新版本火热上线