微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

数据可视化技术指南

2015-11-07 09:20 大数据实验室


图为:美国立法程序


大数据是时下热议的话题,伴随着大数据,同样已经激增的数据可视化方法和呈现形式,让大家意识到数据量的庞大,并不是所有的数据可视化技术是相同的。


数据可视化是一种强大的机制,用来呈现数据并运用进步的技术所创造的独特方法来实现。简单的饼图时代已经走远,因为互动性和独特性的可视化技术正成为科技最前沿,人们也越来越意识到他们喜欢什么和不喜欢什么。


下面的指南将有助于你理解数据可视化的重要性,在行业中所使用的不同呈现方法及最常用的工具,你还将了解优秀的数据可视化背后的关键理念及应当避免的错误。




在这篇文章中,你将学习


1)什么是数据可视化

2)为什么数据可视化很重要

3)数据可视化使用的方法

4)数据可视化背后的关键理念

5)数据可视化中避免犯的严重错误。


什么是数据可视化?


数据可视化是关于图形或图形格式的数据展示。在一个被关注的连贯而简短的报告中体现大量的信息。虽然数据可视化可以处理书面信息,焦点往往是使用图片和图像信息传达给观众。


此外,数据可视化不仅限于涉及到数据的使用。也可能是可视化各种各样的信息 – 你可以将自己的想法与猜想与他人交流。如今,可以添加各种技术应用到数据可视化,甚至是选择交互式的可视化方法。


信息的视觉化表达是一种古老的分享创意与体验的方法。图表和地图是一些早期数据可视化技术的重要例证。


为什么数据可视化很重要?


如上所述,人类已经使用数据可视化技术很长一段时间了,图像和图表已被证明是一种有效的方法来进行新信息的传达与教学。有研究表明,80%的人还记得他们所看到的,但只有20%的人记得他们阅读的!它甚至可以把思想和事件传给后代。技术的发展进一步提高了数据可视化带给人们的机遇。


也许使用数据可视化的最重要的好处是它能够帮助人们更快地理解数据。你可以在一个图表中突出显示一个大的数据量,并且人们可以快速地发现关键点。在书面形式,它可能需要数小时来分析所有的数据及联系。


此外,这种展示巨量数据的能力是另一个数据可视化的优点。一张图表可能会突出显示一些不同的事项,人们可以在数据上形成不同的意见。这自然能为商业开辟新的途径。人们或许能从数据中发现一些意想不到的东西。


数据的可视化展示,提高了解释信息的能力。从海量的数据和信息中寻找联系并不容易,但是图形和图表可以在几秒内提供信息。一望便知,可提供所需的信息。


以上所述,能提高在工作场所或教育机构的沟通和有效性。数据可视化被普遍认为是一种简单而有效的方法来概括数据,因此它是可以提高人们的共享信息和学习的一种方法。


下面的视频是一个数据映像极好方式的范例(视频)




不同的数据可视化方法


技术的发展已导致数据的大爆炸。这反过来又促使数据展示方式的激增。一般来说,大多数据可视化分为2种不同的类型:探索型和解释型。勘探类型帮助人们发现数据背后的故事,而解析数据方便给人们看。


此外,有不同的方法可用于创建这2种类型。最常见的数据可视化方法包括:


  1. 2D区域-此方法使用的地理空间数据可视化技术,往往涉及到事物特定表面上的位置。2D区域的数据可视化的例子包括点分布图,可以显示诸如在一定区域内犯罪情况。


  2. 时态-时态可视化是数据以线性的方式展示。最为关键的是时态数据可视化有一个起点和一个终点。时态可视化的一个例子可以是连接的散点图,显示诸如某些区域的温度信息。


  3. 多维-可以通过使用常用的多维方法来展示目前2维或高维度的数据。多维可视化的一个例子可能是一个饼图,它可以显示诸如政府开支。


  4. 分层-分层方法用于呈现多组数据。这些数据可视化通常展示的是大群体里面的小群体。分层数据可视化的例子包括一个树形图,可以显示语言组。


  5. 网络-在网络中展示数据间的关系,它是一种常见的展示大数据量的方法。网络数据可视化方法的一个例子是冲积图,可以显示医疗业变化的信息。


以上提到了大量的选择,在它可以提供巨大机会的同时,令人头痛的是为你的数据展示选择正确的方法。


还有一些用于数据可视化的工具。这些工具方便收集数据及简化数据的使用方式。


一些常用工具包括:


  1. Google charts:谷歌的产品在数据行业是众所周知的,Google charts是一个方便的工具,特别是对于初次使用的用户。

  2. Datawrapper–这是一个在线工具,它可以帮助你创建交互式数据可视化。

  3. RAW –它的优点是有很多现成的模板框架让你清晰、快捷的呈现信息。该平台开源,能够自定义布局,以及使用其他的设计。

  4. Infogram -新手用户的另一个伟大工具。它允许用户创建不同的图表和信息图,而且系统易于使用。


这些都不是唯一可用的工具,你可以找到其他一些免费和付费软件。为确保你所使用的软件适合你的数据可视化目标,需要多多对比。


数据可视化背后关键概念


看过数据可视化的人都明白设计的好坏。如果这些信息不是以正确的、恰当的方式呈现,那么数据可视化的好处就很容易消失,特定项目需要特定的方法。


无论你的信息是关于什么的,使用数据可视化时要牢记一些理念。以下是优秀数据可视化技术背后核心理念的集合。


了解你的受众


呈现数据前首要做的是思考谁将查看这些数据,为找到合适的数据可视化方法,了解你的受众非常关键。


尽管数据可视化通常是一种简化数据的方法,受众可能仍然存在不同的知识背景,需要为此做好准备。如果你的数据可视化的目标是专业受众,那么你可以使用更适合的方法以及使用专业术语来解读数据。另一方面,普通受众可能需要相同的数据提供更加清晰的解释方式。


同样重要的是要知道受众对数据的预期。他们想要的关键点是什么?你需要清楚呈现到数据中。此外,还需要明白,你的数据意图。


足够的了解数据


除了知道你的目标受众,您还需要了解数据的内涵。如果你不完全明白你的数据,那么你将无法有效将其传达给受众。


你也无法从数据中提取所有信息,所以需要找到关键信息,并以一致的方式呈现它。还需要确定数据的正确性,不是虚构的 – 错误的数据不要可视化!


如果你正确地理解它,你也可以从数据中得到独特而有趣的信息。


讲故事


你的数据可视化还应当力求传达一个故事。你不希望这些数据是一组信息仅仅呈现自己,而是有使用数据背后的信息。这可能是关于引入不同的叙述,并为观众描绘的特定图像。


使用一个故事,往往意味着受众从数据中获得更多的洞察力。它可以帮助受众了解及深入新的信息。


事实上,数据可视化技术是个讲故事的好工具。俗话说:“图像可以讲述一千个故事”是有道理的,你应该用它来做为你的优势。通过数据集讲故事并不困难,因为你可以用颜色,字体及陈述做为你讲故事方法的一部分。

为了使数据可视化讲故事的更加精彩,理解数据这点是至关重要的。


保持简单


近年来,数据可视化已经发展了很快,正如上面所说,有很多工具和系统供你使用。接触不同的独特方法并不意味着你需要使用它们。此外,大量的数据不应该机械地认为所有的信息是必不可少的。


总之,你需要保持你的数据可视化方法简单明了。你不要为了它而想着包含太多的数据信息或使用过多不同的技术。


如果你考虑通过镜头讲故事的,重要的是要了解你的视觉中的每个元素应该是故事必不可少的一部分。如果数据或元素,如某些事物的图片,没有添加任何重要的故事,那么你不应该把它包含在你的报告中。


拥有过多元素的可视化实际上会损坏成品并会偏离数据。你还需要记住数据可视化的好处是直观地呈现大量的数据。如果你的可视化看起来费劲,那么你需要回去看看是否使用了错误的数据呈现方法或包含了太多冗杂的信息。


正确认识平台需求


最后,一个成功的数据可视化技术也关注技术方面。现在,人们通过不同的平台查看和访问信息,重要的是你要记住这点。就像你需要知道目标受众,你也需要考虑人们阅读你的数据可视化的方式。


你需要让你的可视化方便地平台移植,如移动手机,平板电脑或计算机。如果你的用户只通过手机浏览数据,那么你自然会受益于移动手机创建可视化的方法,而不是用笔记本电脑创建数据。


除了考虑该平台的界面选项外,你还需要考虑可访问性问题。如果您的数据可视化允许有视觉障碍的人进行适当的缩放,可以大大提高用户体验。你也可以考虑不同的颜色选择供色盲者。可访问性是提高用户体验,确保你的数据可视化可用于所有受众。


避免可视化数据的严重误区


以上的关键方法可以帮助你建立一个数据可视化策略,你也需要清楚一些常见的错误。


错误信息


上述提到数据中的错误会误导受众。你需要确保那些正在看你数据的人,看到的信息正确。这是你的工作,以确保人们可以从你的图表和图像中使用数据,而不需要再次检查信息。


不完全信息


除了确保所有的信息是正确的,您还需要提供完整的数据。观察者必须在其全部信息中找到相关数据,不要使用数据可视化来欺骗或呈现不完整的信息。


数据可视化可以而且应该讲述一个故事,但故事需要有完整和正确的信息,而不是一份报告中看起来合适的数字。


简单的数据


虽然你需要确保你的数据是在用一个简单的方式呈现,这并不意味着你应该简化它。首先,你需要记住受众–如果你展示给数据的专业人士就不要使用常见的简单语言。另一方面,如果受众对它没有什么意识,就不要用专业术语来填充文字。


除此之外,你也不能期望你的受众在没有借住清晰描述可视化的情况下就能清楚地了解数据之间的联系。你不能因为它似乎显而易见而省略信息-记住,你的受众只会看到你目前的数据,而不是过去使用过的完整数据集!


不合适的可视化


当你呈现数据,你需要仔细思考这些数据。当谈到如字体,颜色和图像,背景是非常重要的。例如,如果你是呈现由于特定的疾病而导致死亡的信息,一个色彩鲜艳,令人愉快的图像似乎是不合适的。


不恰当的可视化涉及到所使用的技术,使它难以查看和理解数据。例如,你可以使用气泡来代表你的部门不同的消费水平,但如果不考虑尺寸的差异,气泡就会误判和不准确。


遗忘注释


过度简化也可能导致缺失注释。当你呈现数据时,很容易假设受众知道图像的每一个方面是什么。简单的添加的注释可以提高用户体验,并确保受众知道你的数据中的所有数据关键点。


作为一个例子,你可能有一个图表显示你的企业在过去十年销售自行车量。如果数据中有一个大的下降或是上升,一个注释解释了这个突然变化背后的原因,将确保观众得到这个额外的信息。


最后的思考


希望上面已经解释清楚了数据可视化重要性的基本点。有许多不同的方法和程序可以帮助你以一种独特而引人注目的方式呈现你的数据。


重要的是理解,在所有酷炫古怪的方法下面,数据可视化是围绕数据–你需要找到一种方法,以正确的,清晰和直达主题的方式概括信息。当你找到正确的方法,数据可视化不仅丰富而且美观。


(来源:36大数据)






股票量化培训课程


量化与对冲概览
股票量化投资工具入门
量化策略之股票多因子选股
量化策略之其他策略


股票量化培训课程非常罕见,主办单位花了很多心血才开出本课程,有志于从事量化投资事业的朋友们不可错过。


咨询报名微信:5424567


详情请点击“阅读原文”


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 Java程序员转Android开发必读经验分享 重磅|UnitedStack有云与思科签署战略合作备忘录 程序员,你知道 Hello World 的历史么? 浅析十三种常用的数据挖掘的技术&五个免费开源的数据挖掘软件 如何让玩家产生代入感?丨Gad有奖问答