微信号:dellemc_tech

介绍:为戴尔易安信客户提供技术支持服务,为广大IT行业用户分享技术文章与行业信息。

EMC存储上的大数据 – 大数据分析实施路线

2017-06-28 16:45 EMC中国技术社区

     企业一直在处理快速增长的数据量(也称为大数据)的存储和管理问题。


     本文为系列的第十篇,介绍了发现适当的大数据业务机会并制定利用该机会的全面路线图。

 

     大数据时代,各公司都在努力挖掘有关他们业务的令人信服的见解,以赢得竞争优势。他们在探索具有独特见解的问题,例如:谁是我最有价值的客户?哪些是我最重要的产品?什么是我最成功的营销活动?


     过去,IT和企业用户只能使用可用企业信息中的一小部分来尝试回答这些重要问题。因此,行业调查记录了这样一些事实,企业领导者们:

  • 常常在不具备他们所需信息的情况下制定重要决策。

  • 根据自觉和经验而不是根据可靠核实的信息制定重要业务决策

  • 意识到组织中的管理者因为无法获取准确的信息而制定了错误的决策

  • 无法再组织范围内获得履行其职责所需的信息


     大量类型复杂的新数据(即“大数据”)现在已可用并且随时可供访问,同时还可提供有关客户、产品和运营的创新见解。这些新的数据源(Web活动、移动或位置数据以及社交信息)再加上传统数据源,提供了达到当前无法实现的业务洞察水平的机会。借助这些新的数据源,企业用户不再局限于仅通过财务指标来衡量成功是否,而是可以考虑客户、产品和营销活动对业务的整体贡献,从而超越其业界同行。

    

     而整个过程中,需要制定大数据战略以利用这些新的业务见解,就意味着企业不能只考虑数据量。一个成功的大数据战略必须考虑获得信息的速度、信息的多样性和复杂性:

  • 数量:数据量达到若干PB

  • 速度:实时生成的接受信息进行分析

  • 多样性:表格、文档、电子邮件、计量、网络、视频、图像和音频

  • 复杂性:每种类型数据都有不同的标注、领域规则和存储格式


     企业需要发现适当的打虎踞机会并制定全面的路线图来利用该机会。通过分布式的方法确保大数据管理和体系结构能够解决因种类繁多的数据格式、获得数据的速度以及信息资产的复杂性而产生的问题。许多现有的工具、平台和方法都可能需要升级才能够发挥大数据的业务潜力。


步骤1:选择最适合的优先业务机会。

    

     确定大数据实施路线的第一步是确定大数据和分析可以在哪方面以及如何支持组织。通过经验和分析评估的方法来确定具有以下特点的战略性业务计划:

  • 跨职能部门

  • 提供有吸引力的业务价值

  • 具有可衡量的目标

  • 具有明确规定的交付期限

 

步骤2:构建驱动下一代业务职能和分析的使用情形


     需要有涵盖报告、控制面板、临时查询和分析全面用户体验,以支持通过大数据实现的更及时的决策制定。可以考虑利用一下情形和方法,确定新的大数据源对企业BI和分析系统的影响:

  • 评估当前BI和分析环境

  • 记录大数据对BI和分析环境的影响

  • 将当前功能映射到大数据的实施曲线

 

步骤3:为更灵活的数据平台创建概念性体系结构


     以OLTP为中心的传统关系数据库管理系统从未针对大数据进行设计。传统的数据管道无法满足大数据分析的需求。快速增长的数据量将传统数据管道推向了面临崩溃的边缘,迫使组织使用数据的摘要和样本。结果就是从数据到分析的周期时间长达数周,而不是几个小时,因此分析的质量也受到影响。基于大规模并行处理(MPP)的新数据仓库提供可扩展、灵活的数据仓库平台,能够挖掘结构化和非结构化大数据的业务价值。企业需要制定计划,以支持快速接收新的结构化和非结构化大数据源,包括:

  • 评估当前的数据仓库黄金并记录大数据对它的影响

  • 评估当前的ETL并记录大数据对它的影响

  • 创建灵活的数据仓库体系结构

 

步骤4:评估数据质量、管理和安全措施的可用性


     待分析的数据必须能够提供您业务的可靠视图。组织需要一个将数据视为一种资产而不是一项开支的“业务计划“。此数据业务计划必须涵盖数据质量、治理和安全措施,并同时开拓内部数据以及第三方数据源。一个全面的、设计合理的计划在运营过程中将会持续不断地监控、增强和确保组织的战略数据存储的安全性、准确性和完整性,并制定数据规程、政策和组织纪律。

 

步骤5:制定应用云功能的愿景


     云体系结构可能会影响企业信息管理功能。它为自助式BI和分析提供了机会。它可以为围绕特定主题领域或业务机会进行的分析提供集成式协作。如果使用得当,它可以快速实现“数据化货币”。为了帮助利用云体系结构实现数据管理功能的转型,企业需要:

  • 针对面临的大数据挑战审核云功能和实现方法

  • 将您当前的功能映射到云架构

  • 确定云可能会产生实质影响的特定体系结构和运营领域,并记录有关数据仓库体系结构和操作、报告和业务职能及用户体验、高级分析部署、数据质量管理等云数据部署建议。

 

步骤6:将查询结构整合到阶段是路线图中。


     企业针对的大数据实施构建一个全面的转型路线图,重点为以划分优先级的关键业务提供支持,该路线图许针对组织特有的技术要求以及功能量身定制。



其它参考文章:

【存储入门必读】存储基础知识



更多精彩内容,请点击阅读原文”进行查看!

如何每天都能收到如此精彩的文章?

①点击右上角点击查看官方账号”→点击关注

②长按并识别下图中的二维码,直接访问EMC中文支持论坛


 
戴尔易安信技术支持 更多文章 VMAX全闪存集成CloudArray 【声音】叶成辉谈新常态下外资科技公司在中国的角色 【存储入门必读】SAN网络性能问题排错指南 【存储入门必读】存储性能瓶颈的成因、定位与排查 【存储入门必读】存储性能瓶颈的成因、定位与排查
猜您喜欢 事件监听器 源自腾讯的产品方法论,100%真实案例,90天带你掌握产品经理全技能 【藏经阁】设计反模式之架构设计 吴小龙同学读者群 小股东怎样保护自己的利益