微信号:dellemc_tech

介绍:为戴尔易安信客户提供技术支持服务,为广大IT行业用户分享技术文章与行业信息。

存储上的大数据,Isilon大数据基础架构

2016-09-01 17:35 EMC中文技术社区

     我们现在处在一个大数据的时代,人人都在谈大数据,用大数据,也希望大数据可以帮助自己做些什么。人们普遍认为,我们的未来居住的星球是数字的,世界是数字的,人本身也可以数字化,至少现在人的行为已经是数字的了,任何事情数字化以后就会出现无限可能。楼主曾经看过一部美剧(Person of Interest),剧中的主角为美国政府构建了一套可识别罪犯犯罪意识/恐怖行为的系统,这个系统通过安装在纽约市的无数摄像头和监控主流的通讯系统,通过图像、声音、电话,信息,社交网络全方位信息,识别可能出现的犯罪行为。但这个系统却被政府认为大材小用而关闭了一部分程序(只是用来检测恐怖行为,而对民间犯罪无视)。主角两人组通过系统中植入的后门发送出来的相关罪犯或受害者的社保号码进行侦破,一次次进行“法外执法”。这个颇有创意的美剧,背后的系统就是一个实实在在的大数据分析系统。

 

     大数据的分析场景众多,引用一句毛主席语录“一切不以结婚为目的谈恋爱都是耍流氓“。那么“一切不谈具体场景的大数据分析也都是耍流氓!”。大数据分析需要满足3R原则“Solve RIGHT Problem”、“Build RIGHT team”、“Use RIGHT tools”。而这个所谓正确的工具,广义上还可以分为三个领域:数据科学、分析框架和大数据基础架构。所以,在我们明确利用大数据需要解决什么问题,然后又有合适的大数据项目团队以后,就需要考虑使用何种高效的工具来进行大数据项目。本篇白皮书就是描述EMC推出的大数据基础架构产品Isilon特点。主要是包括(文字不多,只有图和总结,具体内容看白皮书附件):

 

1. Isilon这款产品,作为工具,它在整个大数据分析流程中的定位是“解决大数据存储”。

 

 

2. Isilon是一个系统可以同时满足多种负载要求,无论是对应实时客户分析系统的快速响应,还是针对基于CRM和外部云数据的批量处理负载,都可以在一个平台上运行,客户不需要专门部署根据不同负载需求的系统。

 

3. Isilon能将原本分散,多类型的数据,快速的整合到一起,并且以不同的数据访问接口提供给数据分析工具,它支持SMB、NFS、FTP、HTTP、HDFS、REST等多种协议。


4. 存储在Isilon中的数据是有保护与恢复的。



 

5. 因为速度快,可以同时接入不同的分析工具,对比哪个工具更适合分析场景需求。分析工具可以是Pivotal,Cloudera、Hortonmworks等等。

 

 

     楼主曾经在前几年看过一篇SNIA对未来大数据分析基础架构预览的分析报告。其中有一张图,个人觉得非常能够体现一个好的大数据基础架构需要满足的要求。应该说,EMC Isilon定位于服务大数据分析的统一基础架构,也是按照这些基本需求来设计的,而且现在看来,现在的Isilon在这些方面已经做得非常不错。

 

 

下一篇内容是大数据基础架构的数据保护。



其它参考文章:

EMC解决方案是什么?

不1ms不是好AFA,全闪存阵列XtremIO优化Oracle数据库性能

想多快就能多快,VMAX3性能服务级别(SLO)加速Oracle数据库

双剑合璧,EMC VNX + XtemCahce加速Oracle数据库

小身材大用途,VNXe部署千人Exchange企业邮箱

私有云案例, VSPEX部署5600个VMware虚拟机

一站式多协议平台,软件定义存储ViPR部署按需共享文件系统案列



更多精彩内容,请点击阅读原文”进行查看!

如何每天都能收到如此精彩的文章?

①点击右上角点击查看官方账号”→点击关注

②长按并识别下图中的二维码,直接访问EMC中文支持论坛


 
戴尔易安信技术支持 更多文章 备份和归档的区别 云计算的三种模型:公有云、私有云和混合云 正确描述IO类型 【大咖讲网络】谁动了我的网络 浅析I/O处理过程与存储性能的关系
猜您喜欢 [征稿启事] 第十七届全国计算语言学学术会议(CCL 2018)及第六届基于自然标注大数据的自然语言处理国际 关于Python中的元类(metaclass)讲解最棒的文章 UML中的依赖关系和关联关系 ENode框架Conference案例分析系列之 - 订单处理减库存的设计 Android中关于项目中对Thread的管理(不是线程池)