微信号:dellemc_tech

介绍:为戴尔易安信客户提供技术支持服务,为广大IT行业用户分享技术文章与行业信息。

医疗行业大数据案例,在数据湖中预测未来

2017-09-14 19:43 EMC中国技术社区

这篇解决方案主要描述的是医疗组织如何在高性能的数据湖上构建与开发他们的数据分析基础架构、数据科学技巧、和数据管理流程。通过数据湖提供的前所未有的医疗数据整合能力与数据智能,医疗服务组织可以针对未来的业务,以数据驱动的方式提供服务。楼主在通读了整篇白皮书以后觉得以下内容值得高亮一下:



医疗行业是数字地球的领跑者



白皮书提供了一篇IDC的研究报告(见附件),医疗行业数据的整体规模会从2013年的153EB发展到2020年的2314EB,年复合增长率达到48%。如果所有的数据都用128gb的ipad平板电脑来存储,并且跌起来,高度会超过8000英里,能有1/3 地球表明到月球的距离。(为什么不用硬盘来比喻,也许跌出来没那么高吧,IDC的研究员们也蛮物理的,反正比喻数据量会很大就是了)


而截至2014年,只有3%的数据被分析,且提供了高附加值的信息。而相比57%的有价值的数据,超过54%的数据未被分析和利用。医疗数据所蕴含的价值还是巨大的。





数据湖是对未来预测的通道



数据湖相比商业智能和数据科学能够发现更大业务价值与未来,以及对未来的预测。因为数据湖提供了所有医疗机构的所有相关数据,组织可以实时地对数据湖中的数据进行近线分析,这种实时的响应可以让医疗组织对实际的医疗案例进行实时决策,探索不同的解决方案的可能性结果。那是当然,整合越多,分析就能月精确,数据产生与得到分析结果越接近,就能越接近未来某个时间点的数据。看似很有道理,不过前提是有健壮的分析方法,当然数据绝对是基础,没有数据再好的方法也没用,所以数据湖的特点就在这里。



数据湖现实中的数据整合分析用例



下面这张图中所展示的是数据湖在医疗行业中整合数据的实施案例。可以看到通过将所有相关的数据整合到数据湖,医疗组织就有能力针对一些特定的状况进行行动。文中举了一个例子,通过数据分析,医院发现在某一个楼层的病人出现手术感染的情况最高,并都是同一个临床医生在岗等等情况下。那么,医院就可以针对特定的人员进行消毒方面的培训来降低未来同样问题发生的情况。数据湖的数据还能够为病人的某些特征,结合外界影响与人口数据,定制不同的治疗计划等等。而且数据湖中的数据整合,还能够为大量病史的临床研究做出贡献,让这个人群都收益。



EMC为数据湖提供强健的基础架构支持



EMC联邦提供的存储、虚拟化计算、大数据分析套件能够丰富数据湖,加速数据湖的部署,为医疗组织构建以数据驱动的大数据业务提供全方位的支持。这个已经谈了很多了,不具体展开了,详细看本连载的其他文章。




数据湖上扬帆



白皮书中还介绍了在数据湖上大数据分析的方法与流程概览。开发了解业务的数据科学团队,规范化数据管理流程等等内容。文章没有详细展开,不过大概的流程基本上就是要数据、业务专家、数据科学专家、正确的方法,才能找到有价值的业务见解。其实数据湖上扬帆,工具就是船了,船长,大副,水水就是这些数据分析中的觉得,都要齐全才能安全行驶大数据分析这艘船,达到业务价值的彼岸。


最后,这篇白皮书所牵涉到的技术内容不多,更多的是一些概念与方法、以及进行大数据分析流程上的东西。楼主觉得这篇白皮书对那些希望实施大数据分析项目的读者来说,参考一种实施的框架,了解一个实际的案例相比一大堆软件的功能来得更加有用。




其它参考文章:

说说EMC解决方案中的那些产品和案例



更多精彩内容,请点击阅读原文”进行查看!

如何每天都能收到如此精彩的文章?

①点击右上角点击查看官方账号”→点击关注

②长按并识别下图中的二维码,直接访问EMC中文支持论坛


 
戴尔易安信技术支持 更多文章 VMAX全闪存部署Splunk性能测试与最佳实践 RecoverPoint拷贝测试、生产数据恢复和故障切换的实践 Fibre Channel over IP protocol(FCIP)基本概念 如何在安装或更换硬件组件时避免静电放电损害(ESD) EMC和戴尔超融合是什么关系?这位CTO来告诉你!
猜您喜欢 【干货】Go语言开发常见陷阱,你遇到过几个? 聊聊代码规范 据说由Basic4android编写的恶意App出现了! HDFS NameNode内存详解 性能测试应该怎么做?