微信号:linux-cn

介绍:『Linux 中国』信息矩阵旗舰号:每日为 Linux 及开源爱好者推送 Linux 相关技术、运维与研发、开源资讯等方面的精选内容;提供 Linux 命令帮助、技术文章检索等功能.

10个顶尖技术大会运维专题下演讲实录(附PPT下载)

2016-06-15 19:42 InfoQ

InfoQ是一个关注中高端技术人的社区媒体,

一线互联网圈从业人士产出原创优质内容,

行业内最专业的编辑团队深度加工,

每天早晨八点推送一篇互联网干货,

专注技术人的交流与成长。

国内最好的原创技术社区,技术大神力荐:

「做技术的不会没听过QCon,不会不知道InfoQ吧?」——Fenng(小道消息)

「从事技术工作,或有兴趣了解IT技术行业的朋友,都值得订阅。」——曹政


1
打造 O2O 业务的数据库支撑平台——百度数据库变更发布系统 DTS实践

王剑英
百度资深研发工程师

随着百度重点投入 O2O 业务,百度糯米、钱包面对的流量日益增长。如何打造一个高效的数据库系统架构来应对交易支付类型的负载,成为百度 DBA 团队面对的一个新挑战。

本次分享将向大家介绍百度 DBA 团队如何以 MySQL 为中心,通过一套高效可靠的数据库变更发布系统 DTS,融和 Cache 平台,业务系统消息队列等。实现对业务请求的快速响应和交易链路的中的调用解耦。

本次分享将包括以下几个内容:

  1. MySQL 变更消息发布系统 DTS;

  2. 基于 DTS 实现 MySQL 和 Redis 的深度融合,提升业务响应速度;

  3. 通过 MySQL 消息通知机制实现糯米交易链路中的逻辑解耦。

扫描二维码关注公众号后,发送数字  11  即可阅读原文。

2
滴滴运维架构的演化史

陆沛
滴滴运维部技术经理

滴滴从 2012 年成立以来,3 年半的时间,经历了几何级数的成长。滴滴运维是如何应对的,运维架构是如何演进的,在这里经历了哪些挑战,可以和大家一起分享一下。

扫描二维码关注公众号后,发送数字  12  即可阅读原文。

3
豆瓣百万级指标监控实践

朱兆龙
豆瓣高级系统工程师

在豆瓣我们使用了 Kenshin + Graphite + Grafana + Icinga 2 的组合来支撑我们的监控需求,其中 Kenshin 是我们自己开发的用于代替 Whisper 的存储组件。

在本次分享中我们将介绍 Kenshin 的设计与实现、如何架构单机支撑百万指标收集的指标系统、以及 Grafana 和 Icinga 2 的使用经验。

扫描二维码关注公众号后,发送数字  13  即可阅读原文。

4
支付宝丝般顺滑的春晚的保障机制

于新林(青轩)
蚂蚁金服支付事业群首席架构师

2016 年春晚,对支付宝来说既是挑战也是机遇。头一次和央视搞这么大规模的活动,这样的活动只能成功不能失败。对于支付宝来说,是第一次搞这么大规模的活动,对用户的行为习惯是没法预测的。如何保障活动顺利是我们头痛的问题。

得知消息后,我们第一时间确定了主题思路,确定了总体目标。接下来通过以下这套方法来保障活动的顺利进行。

  1. 研发质量保障机制

  2. 版本发布管理机制

  3. 活动灰度机制

  4. 全联路压测体系保障容量符合预期

  5. 弹性计算能力,快速按照预期容量模型部署应用和存储模型

  6. 内部演练机制保障整体活动按照预期进展

  7. 春晚前提前小规模活动提前规避问题,根据用户行为调整容量模型

  8. 应急响应体系,以应对意外事件,保障春晚互动顺利进行

扫描二维码关注公众号后,发送数字  14  即可阅读原文。
5
Apache Eagle: eBay构建开源分布式实时预警引擎实践

陈浩
eBay Inc 高级软件工程师,Eagle
项目技术负责人

在与云计算和大数据时代背景下,各种大型分布式系统例如 Hadoop,Spark、Open Stack 等层出不穷,eBay 作为世界顶尖的电商巨头之一,这些系统在驱动 eBay 业务增长的同时,管理维护它们的挑战也愈加严峻,同时对监控系统提出了更高的要求,例如更强的伸缩能力、更实时的预警能力、支持更复杂的预警规则、更加动态灵活的关联预警等,而传统预警系统如 Zabbix、Nagios 、Ganglia 等逐渐疲于满足我们的需求,于是,我们决定从零开始打造全新的分布式实时预警引擎——Apache Eagle。

Apache Eagle (http://eagle.incubator.apache.org/) 是由 eBay 开源的分布式实时监控与预警系统,专注于解决大规模分布式集群(如 Hadoop)运维场景中的服务监控、性能分析、异常预警以及数据安全等问题,于2015年10月26日正式开源并加入 Apache 软件基金会。

扫描二维码关注公众号后,发送数字  15  即可阅读原文。

6
饿了么技术运营实践——急速发展之体悟

徐盎
饿了么技术运营部总

在业务量持续陡升、创新不断、生态逐渐丰满的节奏中,扩容是常态每个应用都可能成为系统的瓶颈。如何减少发现、定位时间,如何快节奏里完善技术运营体系?让我们来反思。

  1. 创业团队各种平台工具各显神通的困局突破

  2. 自动化与业务高交付压力的矛盾

  3. 立体化监控实践

扫描二维码关注公众号后,发送数字  16  即可阅读原文。

7
腾讯游戏运维实践之路&运维价值探索

洪楷
腾讯游戏自研运维中心总监

在游戏业务运维中,涉及MMOGRPG、MOBA、ACG、FPS、ACT、MUG等不同游戏类型,由此而引入了各种异构,运维行业中涌现Puppet、Zibbix、Nagios、Nginx等各种分门别类技术工具。在PaaS、IaaS、SaaS帮运维封装了很多服务,帮助运维降低或者规避风险,除了从工具和云化的平台服务方面帮助业务规避风险,还有那些应该在运维团队中做到?特别在游戏业务的众多异构中有那些手段?传统的运维模式应该如何应对游戏业务转变?运维如何借助业务进行自成长?本次演讲包括:

  1. 运维规范作为基石必要性,建设过程中会有那些“坑”;

  2. 基石——腾讯游戏运维白皮书的构成;

  3. 日常运维中规避“黑天鹅”的手段,重点介绍“Drill”、“PLP”、“key nodes”实战;

  4. 从运维中寻找快乐,运维数据的价值,贴近业务创造价值,以案例介绍运维服务;

  5. 腾讯游戏运维服务体系介绍;

不要让只有故障和突发的时候才想起运维,其实运维也是一个意识形态,运维并不是多做多错,需要利用技术借助数据说明问题,通过对外提供的闭环服务“智胜”,以业务场景设计运维服务,并最终以“智能”引领未来,业务运维(规划)工程师其实可以做得更多更好。

扫描二维码关注公众号后,发送数字  17  即可阅读原文。

8
SRE是什么鬼 / 来自 Google DevOps 经验的落地实践

孙宇聪
Coding.net 技术负责人

Google SRE负责生产运维,管理着全球上百万台服务器和上面数不清的应用,他们的一举一动都会影响全球千百万用户。

本次演讲,曾身为Google SRE(07-14)一员的孙宇聪将带给大家以下几点:

  1. Google SRE是怎样一个团队,有哪些特点,和传统运维团队的定义有哪些不同。其中重点讲SRE 如何在早期,中期,以及长期为项目提供持续性支持。

  2. 在采用Docker等新技术降低传统运维的门槛的同时,运维team在软件生命周期中如何自我定位,实现自我价值。

  3. 从Google带来的运维团队建设Best practices:

  • 建立有效的监控和Oncall应急体制。

  • ODR (Operational Readyness Drill) 如何锻炼团队应对紧急情况。

  • Postmortem文档, 如何正确,认真的面对、跟踪生产环境中出现的问题,并且建立一个完善的机制。

扫描二维码关注公众号后,发送数字  18  即可阅读原文。

9
云时代运维转型:工具化,产品化,运营化

钟红军
大众点评网运维和数据库总监

作为一家超过10年的互联网公司,大众点评的运维实践和运维理念,经历了很多变化和挑战。从2013年开始,点评运维从以前的传统运维方式中,逐步开始探索自己的道路。我们总结是:从工具化,发展到产品化,再到现在的运营化。在这个过程中有些什么思考?为什么要这么做?结果如何?这是本次分享要回答的问题。

扫描二维码关注公众号后,发送数字  19  即可阅读原文。

10
刀尖上的舞蹈——DDoS攻防对抗

朱家睿
阿里巴巴DDoS攻防专家

DDoS攻击是互联网服务的噩梦,DDoS攻防是看不到硝烟的战场。阿里巴巴有众多业务:淘宝、天猫、支付宝、云计算、CDN等。阿里巴巴平均每周监控到上万次DDoS攻击。如何保障集团业务稳定不被DDoS破坏?云业务又如何防御频繁的DDoS?运营团队如何使用防御产品去打每一场胜仗?团队如何在一次次的战斗中形成快速的配合?针对不断变化的攻防态势,未来又将如何应对?


扫描二维码关注公众号后,发送数字  20  即可阅读原文。




更多干货文章,请扫码关注InfoQ公众号



 
Linux中国 更多文章 解决八种Linux硬盘问题的技巧 CoreOS宣布开发自己的容器运行时Rocket 怎么样称得上是Linux下优秀的命令行计算器 HTTPS的“S”的代价 CentOS Linux 7 发布滚动构建版
猜您喜欢 国家科技部火炬中心副主任杨跃承来七牛调研参观 2015基础研究:医疗美容专题研究报告 云智慧API监控-免费体验还有奖(极思维独家报名通道) 关于Docker你应该知道的8件事 TiDB 优化器实现的基础 -- 统计信息的收集