微信号:Caicloud2015

介绍:Caicloud作为中国最早的“集群即服务”云平台开拓者,使用最潮流的Docker技术,以自带服务的形式提供智能调度、效能优化、资源管理、负载均衡、健康监测、故障预警、冗余控制、备份部署等任何抗故障、高稳定性分布...

才云@CCTC2016中国云计算技术大会|CTO邓徳源解析谷歌容器集群管理系统实践

2016-05-10 17:19 才云

        由CSDN重磅打造的2016中国云计算技术大会(CCTC 2016)将于5月13日-15日在北京举办,大会特设“中国Spark技术峰会”、“Container技术峰会”、“OpenStack技术峰会”、“大数据核心技术与应用实战峰会”等四大技术主题峰会,以及“云计算核心技术架构”、“云计算平台构建与实践”等专场技术论坛。80+位一线互联网公司的技术专家将到场分享他们在云计算、大数据领域的技术实践。

        才云科技CTO邓徳源,受邀 2016 中国云计算技术大会(CCTC),将在5月14日 Container 技术峰会进行《谷歌容器集群管理系统实践》演讲分享。




演讲人:才云CTO 邓德源

演讲标题:《谷歌容器集群管理系统实践

时间:5月14日(周六)上午9:00 - 9:40

地点: 北京新云南皇冠假日酒店

专场:Container技术峰会


演讲摘要:

近年来,以Docker、Kubernetes为代表的容器技术已经被众多开发人员认可,并为各大公司采用,其中不乏大型传统企业。谷歌作为容器集群的先行者,在设计之初,即强调提供完整的分布式系统所需的核心功能,包括调度、编排、服务发现,配置管理、灰度发布、健康检查、弹性扩容、环境一致等功能。本演讲主要分享容器集群系统的技术结构变迁,以及基于此类系统的实践经验。


CSDN和CCTC大会也对才云CTO邓徳源做了会前专访,以下篇幅为专访内容,转自CSDN主页(http://geek.csdn.net/news/detail/72890):

CSDN:目前对Docker领域的关注重点是什么?


邓德源:这两年Docker大火,但我们的观点是:Docker只是“开始”,远不是“终点”或万灵药。当很多企业尝试用Docker后,会立刻浮现很多实际问题:docker多了怎么管理,跨主机Docker之间如何通信,在Docker的世界里新的运维流程和体系该如何构建。总而言之,Docker这项新技术,不光意味着新的学习曲线,还可能会改变用户或企业多年所积累下来的开发、运维实践习惯和体系,这才是最大的挑战和鸿沟。


CSDN:能介绍下谷歌在容器集群管理方面的经验吗?


邓德源:谷歌十多年来在容器集群管理方面的经验都体现在谷歌推出的三个容器集群管理系统上:Borg, Omega和Kubernetes。前二者是谷歌对内使用,Kubernetes则是开源项目,基于Borg的理念用Go重新改写的框架。Kubernetes尽管和Borg有相当的差别,大家还是可以管窥一豹,通过它来了解谷歌内部的容器集群设计理念。

CSDN:之前在谷歌的从业经历,对您个人以及公司来说有哪些影响?


邓德源:我曾在美国谷歌(Google)集群管理组工作(Cluster Management Team),和我们才云CEO张鑫是大组的同事。我当时主要参与开发集群管理系统。该系统为谷歌所有运维工程师提供统一的集群管理入口,是谷歌自动化运维的重要组成部分。这个系统保证了系统升级、软硬件错误等均能及时被发现并处理,保证谷歌集群能24/7小时不间断工作。

在谷歌期间还参加了开发基于容器集群的开源项目Kubernetes,这个项目将谷歌多年内部使用容器的经验以开源的形式呈现给所有开发者。

我和CEO张鑫曾经在美国谷歌底层容器集群团队管理开发的第一线积累多年经验,让我们对才云自己的产品和性能定位有非常高的要求。我们在意的是最终Caicloud云平台产品能为国内的客户提供谷歌式、谷歌级的分布式集群管理系统,管理亿万容器。

CSDN:企业在应用Container/Docker技术时,需要做哪些改变吗?企业如果想快速应用Docker应该如何去做 ?


邓德源:对于一个企业,在生产环境上使用容器而言,docker/container本身是不够的,就像我前面提到的,当你把应用和进程都用容器包起来(这一步是简单的)之后,这些无状态的应用/容器之间如何去互联、调度、运维,这些问题容器本身是无法解决的。所以,在企业生产环境的层面上考虑使用容器,一定需要考虑“容器集群”管理的问题。容器集群管理框架的选择,有很多种,这些框架本身在集群功能、实现原理和复杂度上都有很大差异。至于如何选择,首先要对这些框架有基本了解,同时还要结合企业自身的具体需求。


CSDN:你所在的企业在应用Container/Docker或者k8s技术时遇到了哪些问题?是如何解决的?


邓德源:我们Caicloud平台在为我们客户企业服务和落地过程中,基于K8S的框架下很多细节有很多改变和二次开发,这在开源项目来说是不可避免的。

细节的情况可以来参加我们在多个城市定期举行的Kubernetes meetup活动,我们在 meetup讲座中都有很仔细的梳理这些我们在为客户开发过程中遇到的Kubernetes的坑以及我们所提供的解决方案。我们接下来5月21日在上海会有Kubernetes meetup,欢迎大家前来参加、交流。


CSDN:作为当前最流行的Container技术,您认为Docker还有哪些方面需要改进?


邓德源: Docker作为一个备受瞩目的新技术,也存在诸多方面需要改进。例如如何能更平滑的使传统企业应用过渡到Docker中,如何应对有状态应用,如何在大规模生产系统中进行运维和管理,这些都需要在Docker外,通过更广大的生态圈来予以解决。


CSDN:您在本次演讲中将分享哪些话题?


邓德源:我在这次大会的分享题目是:《谷歌容器集群管理系统实践》,会从我在谷歌底层集群团队所做的集群管理系统为切入口,来介绍谷歌内部的集群管理系统,从具体流程上给大家介绍谷歌的经验,如何来保证管理运维工程师提交的生产环境变更请求,自动化风险分析,自动化生产环境准备工作,及各种集群容错处理。谷歌内部的容器集群管理范畴要远大于Borg,来保证谷歌系统升级、软硬件错误等均能及时被发现并处理,保证谷歌集群能24/7小时不间断工作。


CSDN:哪些听众应该了解这些话题?您所分享的主题可以帮助听众解决哪些问题?


邓德源:有上容器、容器集群、微服务需求的企业;在分布式系统使用上对以下功能有需求的企业:包括调度、编排、服务发现,配置管理、灰度发布、健康检查、弹性扩容、环境一致等功能;同时,企业对自身系统的高可用性、稳定性、高性能以及易用性有需求。这些企业都很适合来了解谷歌内部集群系统的讨论,不仅可以对谷歌十多年来内部使用容器集群的整体设计架构有所了解,同时也可以把这些设计原理应用到自身企业。



 
Caicloud 更多文章 才云科技摇篮——创客天下·2015杭州市海外高层次人才创新创业大赛总决赛 浙江卫视《义行天下》栏目组采访才云科技 政府重点扶持才云科技,小伙伴们快来看! 才云科技往来客——七牛、南京云创、蚂蚁金服、阿里百川.... 才云科技:#赢加TV采访实录#
猜您喜欢 此文征名 《架构师成长之路》连载之NO.3 聊聊高并发系统限流特技-2 Filmie 一次动效和交互的实验 上云路上再出发,我选择了FIT2CLOUD