微信号:dellemc_tech

介绍:为戴尔易安信客户提供技术支持服务,为广大IT行业用户分享技术文章与行业信息。

EMC Isilon– “Scale Out”时代

2016-06-02 18:21 EMC中文技术社区

     感觉最近IT界有一个词非常热 – “Scale”,我们今天要讨论的就是一个为"Scale"而设计的系统。其实这个词应该已经“热”得挺久了,可能是自己才开始关注一些新概念、新产品,从而触发了此感。相信IT同仁们对于"scalability"这个次已经如雷贯耳,因为几乎任何一家厂商在发布新产品时,总要冠上诸多”xx-bility”的字眼,什么” availability”, “flexibility”, “reliability”等等…每次看到"scalability"我都觉得很陌生,一时不知道怎么理解,查完词典发现“可伸缩性”是一个不错的翻译,如果你还是认为不好理解,那暂且将其想象成“金箍棒”的代名词吧,我们总是希望自己的IT环境也能像这根定海神针一般,可随时扩大/缩小,以满足不断变化的业务需求,实现更简易的运维,扩展升级不用停机,资源利用率攀升。

 

     NAS是一个非常普遍的应用,各大厂商相互竞争的产品总的来说在架构上没有异同点,基本就是“铁棍”与“钢棍”的比较,要想变身“神棍”,不彻头彻尾地重新设计一番是办不到的。EMC Isilon就是这样一种新型NAS,诸多设计都让人觉得山水轮流转,没有进步必然会被淘汰。我们今天就来看一下Isilon究竟有哪些先进的地方。


目前面临的挑战


     当我们这些小虾米还在努力学习部署、安装、使用、调优当前的NAS设备时,那些被视为神一般存在的“大拿”们已经在为目前的设计感到堪忧,开始着手开发新的解决方案了。他们究竟看到了什么,小虾米在这里列举一二:

目前的SAN/NAS架构不适合Scale - 技术更新换代的动力来自于需求的更变,NAS/SAN在20年前就开始设计了,不同的是20年后的今天数据已经在这个星球爆炸了,知道为什么大数据现在这么热了吧,分析分析整理整理就是Money啊!不过话说回来,没有“给力”的设备你可玩不了大数据,它对处理能力和存储空间的要求可是非常可怕的。传统SAN/NAS由于传承了DAS的血液,在scalability上非常吃力,很多产品虽然也能实现扩展,收缩,但总得来说都不那么乐观,停机是常有的事儿。我是没听过哪个客户敢在非停机时段做迁移和扩展的,说白了还是不信任目前功能的可靠性。

RAID不适合Scale – 你一定见过 4+1, 8+1, 14+1这样的RAID5,见过99+1吗?应该没有吧,且不说理论上是否支持,如果坏了一块盘,系统要XOR 98块的数据做重构,这是何等开销?重构时间非常久,而且在重构期间再次损坏磁盘的概率也非常大,镜像也是如此。另外,现在的SATA盘动辄几个T,要重构几个T的数据可能要1整天,这是很多业务所不能接受的。

资源浪费 - 许多存储厂商计算过,他们卖出的存储中50%是空闲的,而且在电力、制冷以及管理上也都是额外的耗费。为什么要这么浪费,用户“人傻钱多,速来”?绝对不是,因为用户心存疑虑,担心哪天容量不够,性能不够的时候需要大动干戈地做迁移啊、升级啊、扩容啊等等会被业务部门咒骂的动作。由此可见,目前的scalability确实不行。

容灾方案过于傻瓜 - 在大多数企业环境中,作为RAID保护的补充,我们通常使用镜像技术将数据从一个系统复制到另一个系统,这是一种非常简单、暴力式的手段,用以解决可用性问题。一个很明显的缺点是,你需要额外的存储空间、处理开销、网络带宽以及运维开销。

热点数据是动态的 - 你永远无法预测哪个卷会忽然变得很忙,当你使用修炼千年的上乘武功做性能调优且成功之后没多久,经理可能就跑过来告诉你这个卷不再是热点,另一个原本默默无闻的家伙可能就此突显其重要性,于是乎你又开始一整套“KOF 97‘连续技+无限连击”,有意思吗?小环境下或许你还能应付,但在大规模的环境下,几百个人冲过来,你就等着被”KO”吧,这基本是不可能的任务。另外,当调优已经没有任何意义,升级硬件才是唯一方案的时候,你是否觉得自己在悬崖边,进退两难?很显然,老话重谈,迁移数据意味着你可能会有几天不能合眼了。


总而言之,SAN/NAS从其设计之初至今20年了,人类消费数据的方式早已今非昔比,它们已经无法满足今天所面临的挑战。我们急需一个新的平台,这个平台必须能够从容应对需求变化,scale必须低成本(cost-effective), 无停机(non-disruptive), 可预见(predictable)以及便于管理(simple to manage)。

 

 

Isilon的关键技术

 

     OneFS操作系统 – 传统NAS的NAS头在本质上是独立的,运行自己的操作系统、文件系统,单独处理I/O,CPU/RAM/NETWORK都是独享资源。硬件是死的,但软件可以是活的,如果想打破这种架构的限制,必须要有一种文件系统跨硬件通信,使其下层的所有硬件都作为一个资源池为其提供服务。在2000年,Isilon之父看到了传统存储架构的弱点以及快速增长的文件数据,便开始开发一种革命性的新型存储架构,OneFS操作系统。这个设计最重要的一点,也是与其它架构最根本的区别在于,OneFS不再把硬件作为其存储架构的关键部分,它将传统存储架构的三个层次 – 文件系统、卷管理器和RAID – 结合在一起形成一个统一的软件层级,从而创造出了一个跨越群集内所有节点的智能文件系统。这种架构使得添加存储节点以提供性能和容量是一个非常简单且不会造成宕机的过程。

        

     Scalability - 传统NAS的扩展方式称为“scale up”,即为单个NAS添加额外的处理能力和存储以增加性能和空间,Isilon的方式称为“Scale-Out”,即增加集群节点,你要做的就是把新的节点放入机架,连接至Infiniband network,最后命集群将新的节点加入其中(Isilon节点之间的通信走的是Infiniband,这也是其高性能的一个体现,不了解朋友可以查看http://en.wikipedia.org/wiki/InfiniBand)。

 

     Autobalance - 你的数据是分散在Isilon集群的所有节点上的,这意味着为I/O请求提供服务的永远都是整个集群,而不是单个节点,这是分布式计算架构的一大魅力所在。热点数据不会集中在某一台node上,所以你不用担心单个节点会成为瓶颈。

 

     性能 - 一个Large-scale存储系统必须能够为各类workload提供性能上的需求,无论它们是连续的、并发的或是随机的。OneFS通过系统节点数的增加,吞吐量也呈线性增长。有了均衡数据分布、自动重新均衡、分布式处理,OneFS能够利用额外的CPU、网络端口以及内存。OneFS还提供还提供一个跨越所有节点的全局可访问一致性缓存。每一个节点都有自己的DRAM(6GB~96GB),随着更多节点的加入,全局缓存也会增加,使得更多的热点数据能够存活于缓存中,最终可以达到13.8TB的缓存。

 

     可管理性 - OneFS被设计成一个易于管理的系统结构,并且随着系统规模的扩大也依然维持此简易性。通过SmartConnect和Autobalance,避免了人工对连接、数据负载做均衡,快速地增加了性能和容量。

 

     数据保护 - OneFS不依赖RAID技术提供数据保护,而是拥有自己的核心技术 – FlexProtect,基于坚实的数学结构,使用Reed-Solomon编码提供冗余和可用性。FlexProtect允许同一时刻最多有4个失败事件发生,可以是整个节点或单块磁盘。另外,随着集群规模的扩大,FlexProtect将使得单个失败事件的恢复/重构时间变得更小。FlexProtect为每一个文件独立保存保护信息,当Isilon系统发生了节点/磁盘故障,FlexProtect能够确定文件的哪些部分受到了影响,并使用多个节点参与文件重构。Autobalance功能将文件跨集群分布,可用于数据重构的spindle/CPU要远超传统硬件RAID。另外,FlexProtect并不是将数据重构至某块空闲盘,而是将文件数据重构至可用空间,形成一个虚拟“hot spare”。

 

     每一个写操作都是以事务的形式提交(commit)到NVRAM Journal(有电池支援),防止由于节点/cluster失败导致的数据完整性问题。当发生写操作失败时,NVRAM Journal使得节点重新节点重新加入集群,不需要做文件系统一致性检查。由于整个系统没有单点失败(SPOF),即使发生了NVRAM失败,文件系统在事务级别也是安全的。

 

总结

 

     可伸缩性、性能、易于管理和数据保护是当今存储系统满足用户需求的重要方面。OneFS为我们提供了一个高性能的系统,同时没有增加额外的管理复杂性。下一代数据中心必须设计为向scalability看齐,解决我们之前提到的所有挑战。这是一个scale-out的时代,而Isilon正走在这个时代的前列。在阅读Isilon相关资料的时候,发现内容实在很多,没有时间一一钻研,今天提到的只是很小的一部分,有兴趣的朋友可以去Isilon的官网下一些PDF看看,确实非常强大。小虾的这篇文章仅作为一个引导,个人能力有限,有错误的地方还请大侠们纠正轻拍。

 

 

更多精彩内容,请点击阅读原文”进行查看!

如何每天都能收到如此精彩的文章?

①点击右上角点击查看官方账号”→点击关注

②长按并识别下图中的二维码,直接访问EMC中文支持论坛


 
戴尔易安信技术支持 更多文章 VNX单块硬盘更换演示 VNX 25-Drive(磁盘驱动器)更换演示 VNX 15-Drive(磁盘驱动器)更换演示 Unity 2.5英寸磁盘驱动器更换演示 Unity 3.5英寸磁盘驱动器更换演示
猜您喜欢 程序员,请对自己好一点! 分布式还是混合式? 谈CDN架构对服务质量的影响 准备学Java的同学看过来,初学者入门必备! JVM 优化经验总结 去哪儿网——项目管理平台助力研发效率提升