数据可视化 抽象信息的图形化显示是否有两个目的:意义解释(也称为数据分析)和交流. 重要的故事存在于皇冠官网登录的数据中,数据可视化是发现和理解这些故事的强大手段, 然后把它们展示给别人. 信息是抽象的,因为它描述的不是物理的东西. 统计信息是抽象的. 是否涉及到销售, 疾病发病率, 运动性能, 或者其他什么, 即使它不属于物质世界, 皇冠官网登录仍然可以直观地展示它, 但要做到这一点,皇冠官网登录必须找到一种方法,使没有形式的东西有形式. 这种将抽象转化为视觉的物理属性(长度, 位置, 大小, 形状, 而且 color(举几个例子)如果皇冠官网登录对……有所了解,皇冠官网登录就能成功 视觉感知 而且 认知. 换句话说,为了有效地可视化数据,皇冠官网登录必须遵循 设计原则 源自于对人类的理解 感知.
俗话说得好, “一幅图胜过千言万语”——通常情况下还不止如此——但前提是故事最好是用图形而不是语言来讲述,而且画面设计得很好. 你可以一整天都盯着一张数字表,但当你看到一张相同数字的好照片时,你永远也看不出什么是显而易见的. 请允许我举例说明. 下面是一个简单的销售数据表——一年的价值——分为两个地区:
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.1
这个表非常好地完成了两件事:它精确地表达了这些销售值,并提供了一种有效的方法来查找特定地区和月份的值. 但如果皇冠官网登录要找规律的话, 趋势, 或者这些值之间的异常, 如果皇冠官网登录想快速了解这些数字所包含的故事, 或者皇冠官网登录需要比较一整套数字,而不是一次只比较两个, 该表失败.
现在看看下面这张相同信息的折线图:
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.2
现在有几个事实映入眼帘:
国内销售一直大大高于国际销售.
国内销售全年呈上升趋势.
国际销售, 与此形成鲜明对比的是, 保持相对平稳, 但有一个明显的例外:8月份大幅下降.
国内销售呈周期性上升趋势, up, 下降——这种情况每季度都在重复, 总是在季度的最后一个月达到峰值,然后在下一季度的第一个月急剧下降.
当这些数字以文本形式出现在表格中时,它们无法传达什么, 皇冠官网登录的大脑通过语言处理来解释它, 在视觉交流时变得可见和可理解. 这就是“数据可视化”的力量."
虽然数据可视化通常具有之间的关系 定量 值,它还可以显示本质上不是定量的关系. 例如, 社交网站(如Facebook)上人与人之间的皇冠老牌网站或恐怖分子嫌疑人之间的皇冠老牌网站可以使用节点和链接可视化显示. 在下面的例子中, 人是节点, 用圆表示, 它们之间的关系就是链接, 用连接它们的线表示.
作者/版权所有人:由Jeffrey Heer和Danah Boyd使用Vizster提供. 版权条款和许可:CC-Att-ND(创作共用属性-无派生.0 Unported).
图35.3
以实体之间的关系为特征的可视化, 比如上面例子中的人, 也可以通过添加定量信息来丰富吗. 例如, 任何两个人互动的次数都可以用连接他们的线的粗细来表示.
35.1历史背景下的数据可视化
至少从公元2世纪开始,人们就开始将数据排列成表(列和行).E., 但是,直到17世纪,用图形表示定量信息的想法才出现. 对于这个 创新 皇冠官网登录要感谢法国哲学家和数学家勒内·笛卡尔. 他发明了一种二维坐标系统来显示数值, 由一个变量的水平轴和另一个变量的垂直轴组成, 主要作为一种执行数学运算的图形方法. 直到18世纪后期,皇冠官网登录才开始利用图形的潜力来进行定量数据的交流, 这要感谢苏格兰人威廉·普莱费尔. Playfair开创了许多今天常用的图表. 他是第一个使用从左到右上下移动的线条来显示价值观随时间变化的人, 如下面的例子所示. 他还发明了条形图, 在他休假的一天,他发明了饼状图, 皇冠官网登录后来发现这种方法相对无效, 因为它将值编码为视觉属性(主要是每个切片的面积以及它在饼的中心形成的角度),皇冠官网登录不容易感知和比较.
作者/版权所有人:威廉·普莱费尔提供(1759-1823). 版权条款和许可:pd(公共领域(公共财产且不包含原始作者的信息)).
图35.4: Playfair在他的论文中收录了这张图表 商业和政治地图集 (1786年)反对英国通过国债为殖民战争提供资金的政策.
随着时间的推移,定量图的使用逐渐增多, 但直到20世纪下半叶,他们的方法和有效性才有了很大的发展. 雅克·贝尔坦在1967年出版了这本书,为过去半个世纪所取得的大部分进展奠定了基础 Semiologie图表 (图形的符号学, Bertin 1967). 他的工作非常关键,因为他发现视觉感知是根据可以遵循的规则来运行的,这些规则可以直观地表达信息, 很明显, 准确地, 有效地.
真正让皇冠官网登录认识到数据可视化作为一种探索和理解定量数据的手段的力量的人是普林斯顿统计学教授John Tukey, 谁在1977年提出了一种全新的统计方法 探索性数据分析.
In 1983, 今天在这一领域工作的人,他的名字比所有人都更广为人知, 爱德华•塔夫特, 出版了他开创性的著作 定量信息的可视化显示. 在这篇文章中,他指出,有一些有效的方法可以直观地显示数据,还有一些方法是大多数人都在使用的, 效果不太好. 同样在这个时期致力于改进数据可视化实践的还有William 克利夫兰, 谁为统计学家扩展和改进了数据可视化技术.
此后不久,学术界出现了一种新的研究专业,它被称为“信息可视化.在他们1999年的书中 信息可视化阅读:用视觉思考, 斯图亚特·卡, 运动员Mackinlay, 本·施奈德曼将当时最好的学术成果集中在一册书中,并做出了发现 可访问的 学术围墙之外(卡 et al 1999).
从21世纪开始, 数据可视化已经普及, 当它通过商业软件产品传播到大众时,往往是以一种可悲而无效的方式. 感激地, 在众多以表面上吸引人的方式促进数据可视化的产品中 美学 以上有用有效的数据探索, 推动实施, 和沟通, 有一些认真的竞争者正在帮助皇冠官网登录以实际而有力的方式发挥皇冠官网登录的潜力.
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.5:此显示, 由相同数据集的多个视图组成, 是用Tableau软件创建的, 目前少数几个了解数据可视化的软件供应商之一.
在那些为皇冠官网登录理解数据可视化做出贡献的人当中, 科林·威尔(Colin 制品)将其实践建立在对人类感知的理解之上. 威尔的两本优秀的书 信息可视化:设计的感知 (制品, 2004)和 设计的视觉思维 (制品 2008) -编译, 组织, 并解释皇冠官网登录从几个科学学科中所学到的皇冠老牌网站视觉思维和认知的知识,并将这些知识应用到数据可视化中.
35.给眼睛和心灵的图片
数据可视化的成功之处在于,它以一种皇冠官网登录的眼睛可以识别、皇冠官网登录的大脑可以理解的方式对信息进行编码. 做到这一点更像是一门科学,而不是艺术, 皇冠官网登录只能通过研究人类的感知来实现吗. 目标是将抽象的信息转换为易于理解的可视化表示, 有效地, 准确地, 有意义的解码. 考虑一个案例,当你需要帮助人们了解美国人的主要死亡原因时,如下表所示:
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.6
为了实现这一目标,显示器应实现以下几点:
清楚地表明值之间的关系, 在这种情况下,哪个是部分到全部的关系——每种原因的死亡人数, 当总结, 等于这一年中所有的死亡人数.
准确地表示数量.
这样比较数量就容易了.
可以很容易地看到值的排序顺序, 比如从主要死因到最小死因.
让人们清楚地知道应该如何使用这些信息——他们应该用这些信息来完成什么——并鼓励他们这样做.
以图形方式显示此信息的传统方法包括一个饼图,如下所示.
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.7
这个饼状图在多大程度上满足了皇冠官网登录的有效性标准? 让皇冠官网登录考虑每个需求.
这清楚地表明了你们之间的关系? 是的. 饼图的主要优点在于它清楚地表明了值之间的部分到整体的关系.
准确地表示数量? No. 饼图通过使用三个可视属性对值进行冗余编码:每个切片的面积, 夹角:每一片在饼中心形成的夹角, 以及每一片沿馅饼周长的长度. 即使这个区域, 角, 并对每个切片的周长进行了合理的计算, 它的失败在于皇冠官网登录不能准确地感知这些属性中的任何一个. 人类的视觉感知还没有进化到支持对区域的准确解码, 角, 或者曲线上的距离.
这样比较数量就容易了? No. 因为皇冠官网登录不能准确地感知这些值,所以皇冠官网登录也不能轻易或准确地比较它们. 此外, 在这个饼状图中, 因为已经用图例标记了切片, 皇冠官网登录被迫一遍又一遍地查找皇冠官网登录希望通过找到正确的颜色来进行比较的切片的含义, 哪一个往往很难辨别. 事实上,这个饼图是3d呈现的,这也使简单的比较行为变得复杂,因为视角扭曲了切片的相对大小和形状, 使底部的切片看起来比顶部相同大小的切片更大更突出.
可以很容易地看到值的排序顺序? No. 尽管这些切片是按照从最高值(心脏病)到顶部顺时针到最小值的顺序显示的, 排除最后的“所有其他原因”部分, 这个排名并不明显, 因为很难对切片进行比较. 例如, 由于3d效果,红色癌症切片似乎比蓝色心脏病切片更大, 哪个给了它更多的视觉重量. 这种饼图的3d渲染效果有时被用来故意误导.
明确了人们应该如何使用这些信息? 部分. 虽然饼图成功地鼓励人们对各个部分进行比较,以了解每个部分对整体的相对贡献, 它未能有效地支持这项行动.
鉴于这张饼状图无法与人类的感知相匹配, 让皇冠官网登录考虑另一种显示形式. 下面的柱状图显示了相同的一组值, 但以一种更容易被察觉的方式.
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.8
让皇冠官网登录使用与之前相同的标准来回顾这个柱状图的有效性.
这清楚地表明了你们之间的关系? 是的. 就其本身而言, 条形图并不说明这些值之间的部分到整体关系的性质, 因为, 与饼图不同, 条形图也可以用来显示其他关系. 这个柱状图, 然而, 包含明确关系性质的组件, 包括标题(“总死亡人数。...),尤其是总和为100%的那一列.
准确地表示数量? 是的. 每个条结束的水平位置和与x轴上的定量刻度相关的长度都以一种可以准确感知的方式编码这些值. 不同地区, 角, 以及没有共同基线的曲线的长度, 二维位置和长度的直线物体,如这些条, 哪些视觉属性具有共同的基线并彼此平行,皇冠官网登录可以高度准确地感知它们.
这样比较数量就容易了? 是的. 因为当这些值被编码成条形时,皇冠官网登录可以准确地感知这些值, 比较它们也很容易. 请注意,在比较饼的切片时不容易看到的这些条的长度差异是多么容易. 还要注意,当每个条共享相同的颜色时, 不像馅饼的切片, 颜色各异, 皇冠官网登录的眼睛被鼓励去比较这两根棒子,因为它们很相似. 因为条形图上直接标注了死因, 在比较值时,皇冠官网登录必须不再做图例要求的工作.
可以很容易地看到值的排序顺序? 是的. 因为棒子长度的差异很容易察觉, 他们的排名从高到低, 除了最后的"其他原因"一栏, 是显而易见的. 通过排列杠铃的顺序, 皇冠官网登录还通过在图表中放置价值最接近的死亡原因使比较变得更容易.
明确了人们应该如何使用这些信息? 是的. 应该比较这些柱状图,以了解这些死亡原因对总死亡人数的不同程度,这是显而易见的.
比较饼状图和柱状图的感知效果的目的并不是为了反对饼状图(尽管这种情况值得讨论), 但是为了说明 皇冠官网登录应该总是通过皇冠官网登录可以轻松地判断可视化的优点, 有效地, 准确地, 并有意义地理解信息所讲述的故事. 要做到这一点, 皇冠官网登录必须理解用于显示特定故事的各种图形方法的感知优势和劣势. 要做到这一点,皇冠官网登录必须理解感知.
35.3数据可视化与人类感知
数据可视化之所以有效,是因为它改变了感知和认知之间的平衡,从而更充分地利用大脑的能力. (我看到.这是由位于大脑后部的视觉皮层控制的, 是否非常快速高效. 皇冠官网登录毫不费力就能立即看到. 思考(我.e. 认知), 哪个主要由大脑前部的大脑皮层控制, 会更慢更低效吗. 传统的数据意义构建和表示方法几乎所有的工作都需要有意识的思考. 数据可视化将平衡转向更多地使用视觉感知, 尽可能利用皇冠官网登录强大的眼睛.
作者/版权所有人:未知(待定). 版权条款和许可:未知(有待调查). 中“例外”一节 版权条款 下面.
图35.9
对知觉科学最早的贡献之一是由心理学的完形学派做出的. 这项研究始于1912年,最初的目的是为了揭示皇冠官网登录是如何感知模式的, form, 以及皇冠官网登录所看到的组织. 两位创始人观察到,皇冠官网登录以特定的方式组织皇冠官网登录所看到的东西,以努力使其有意义. 努力的结果是一系列的 完形原则 感知,这在今天仍然被认为是对视觉行为的准确描述. 以下是一些可以为皇冠官网登录的数据可视化工作提供信息的原则:
接近 | 靠近的物体被视为一个群体. | |
相似 | 具有相似属性的对象(例如.g.颜色或形状)被视为一个群体. | |
外壳 | 对象周围似乎有一个边界(例如.g.(由一条共同颜色的线或区域构成)被视为一个群体. | |
关闭 | 开放的结构被认为是封闭的, 完整的, 只要有一种方法可以合理地解释它们,它们就是有规律的. | |
连续性 | 排列在一起或看起来是彼此的延续的对象被视为一个组. | |
连接 | 被连接的对象(e.g.)被视为一个群体. |
除了信息可视化之外,各个学科的工作也对视觉感知和认知产生了新的见解, 如 人为因素 以及人机交互, 但没有哪个理论比认知科学的理论更具开创性, 特别是 认知心理学. 今天, 用新的和改进的技术和方法来探索大脑, 提高数据可视化的感知有效性的机会比比皆是. 有两个研究领域尤其有用:
前注意视觉加工
注意和记忆的机制和局限性
数据可视化的最大优势之一是皇冠官网登录处理视觉信息的速度比口头信息快得多. 前注意视觉处理是在有意识意识之前自动发生在大脑中的部分. 它由几个阶段组成, 每一种都由专门的神经元处理,这些神经元被调整为检测从物体表面反射的光中包含的视觉信息的特定属性, 然后在皇冠官网登录的脑海中拼接成那个物体的画面. 皇冠官网登录可以使用这些基本属性, 比如长度的差异, 大小, 色调, 颜色的强度, 角, 纹理, 形状, 等等......, 作为数据可视化的构建块. 当皇冠官网登录以一种知情的方式这样做时, 皇冠官网登录有能力转移解码视觉显示内容所需的大部分工作, 比如一个图表, 从缓慢的意识, 大脑中能量密集的部分转移到需要较少能量的大脑中速度较快的部分, 哪一种会导致更有效的认知.
皇冠老牌网站注意力和记忆的研究表明,皇冠官网登录在意识中同时保持多个项目的能力是惊人的有限. 这种认知使皇冠官网登录依靠外部形式的信息存储来增强注意力和记忆力. 最有效的方法之一是对信息进行可视化编码, 这使得更多的信息被集中到工作记忆中有限的插槽中. 另一种方法是同时将几种信息视图放在皇冠官网登录的眼前, 因此,扩展了皇冠官网登录探索多维数据的能力,从多个角度进行比较,并看到皇冠老牌网站,如果皇冠官网登录必须一次消费这些视图,这将是不可能的, 由于工作记忆的限制. 好的数据可视化技术和技术, 正确地使用, 能否将皇冠官网登录的思维扩展到分析意义构建的新领域, 皇冠官网登录还只是刚刚开始挖掘这种潜力.
35.4未来发展方向
数据可视化领域最需要的是什么, 和其他领域一样, 并不总是最令人兴奋的,甚至不是特别创新的. 有时候,皇冠官网登录只是需要让那些有效的事情变得更容易. 这方面的一个例子是,一些软件供应商努力将数据可视化最佳实践构建到工具中, 比如默认的形式, 因此,做有效的事情更容易、更少时间,而做无效的事情更困难、更昂贵. 除了这些简单的, 简单但经常被忽视的改进, 其他一些地区也有铀浓缩的潜力, 如以下:
地理空间和网络显示(如节点和链接图)与其他形式的显示的集成,以实现无缝交互和同时使用.
协同数据意义构建的技术支持,将多个大脑的互补优势整合在一起.
数据可视化的应用超越了描述性统计到预测分析领域, 比如通过使用交互式预测视觉模型,
数据挖掘算法与数据可视化更紧密地集成,以查找有意义的模式,从而提供更好的方法来检查和探索这些模式.
改进的人机界面设备,以更快速和无缝的方式与数据可视化交互.
所有这些都在一定程度上被追求, 但如果更多的研究人员专注于解决皇冠官网登录当今世界面临的实际问题,就可以更快地利用它.
35.5在哪里了解更多信息
几所大学已经开发了专门研究和推进数据可视化的研究生课程. 马里兰大学, 斯坦福大学, 北卡罗来纳大学, 加州大学, 加州大学伯克利分校, 和佐治亚理工学院都是最好的. 虽然在计算机图形学和人机交互等更广泛领域的一些期刊中包含了皇冠老牌网站数据可视化的文章, 只有一份学术期刊专门报道该领域: 信息可视化杂志,由Palgrave Macmillan出版社每季度出版一次. 一些较小的出版物专注于使数据可视化实用并为更广泛的受众所访问, 比如 视觉商业智能通讯. 专门讨论这一领域的会议也很少. 最古老的是IEEE VisWeek, 其中包括完全致力于数据可视化的InfoVis和VAST(可视化分析科学与技术)子会议, 仍然是最大的,也许是最好的会议, 但该领域的重要工作也出现在其他具有更广泛视角的会议上, 如 气 (人机交互)和SIGGRAPH.
35.5.0.计算系统中的人为因素
2011201020092008200720062005200420032002200120001999199819971996199519941993199219911990198919881987198619851983198
35.5.0.2 SIGGRAPH -计算机图形学和交互技术国际会议
20022001200019991998199719961995199419931992199119901989198819871986198519841983198219811980197919781977197619751974
35.5.0.3 infoovis - IEEE信息可视化研讨会
2005200420032002200120001999199819971995
刷新异常, 包括Tableau Software和TIBCO Spotfire, 两者都是学术工作的副产品, SAS无条件转移指令, 这源于对统计学的深刻理解, 还有其他一些相对较小的供应商, 正在逐渐从主导市场的大型软件公司——尤其是商业智能供应商——那里偷走他们应得的关注吗. 除了产品供应商, 一些研究实验室和咨询公司也在为该领域的发展和应用做出贡献, 包括微软研究院, 太平洋西北国家实验室, 流媒体, 眼睛的信息, 和感知边缘.
已经有好几本皇冠老牌网站数据可视化的好书了. 以下, 按时间顺序排列, 特别适用于实地调查和作为基本指导的来源:
塔夫特——爱德华·R. (1983): 定量信息的可视化显示. 柴郡,康涅狄格州,图形出版社 | 塔夫特的四本书都很出色,但他的第一本是最好的. 它为卓越的图形设计提供了一个鼓舞人心的案例. |
克利夫兰——威廉·S. (1994): 图表数据的要素. 霍巴特新闻 | 数据可视化实践侧重于统计人员的需求. |
哈里斯——罗伯特·L. (2000): 信息图形:一个全面的图解参考. 牛津大学出版社,美国 | 信息图形的百科全书参考. |
卡——斯图尔特·K., Mackinlay——乔克·D. 而且 Shneiderman, Ben(编者).) (1999): 信息可视化阅读:用视觉思考. 学术出版社 | 截至出版日期,该领域最好的学术研究概述. |
几, Stephen (2004): 给我看数字:设计表格和图形来启发. 分析新闻 | 一个访问, 实用, 并全面指导设计的表格和图形通信. |
制品,科林(2008): 视觉思维:用于设计. 摩根考夫曼 | 对视觉感知和认知的生动介绍,因为它与数据可视化有关. |
几, Stephen (2009): 现在你看到了:定量分析的简单可视化技术. 分析新闻 | 一个可访问的和实用的指南数据可视化分析. |
许多博客和在线论坛都以数据可视化为特色——有些是经过深思熟虑的, 基于专业知识, 还有一些则带有网络上常见的浅薄. 以下是一些最好的例子:
塔夫特.com (ddd)
感性的边缘 (Stephen很少)
渴望的眼睛 (罗伯特·Kosara)
视觉的复杂性 (Manuel利马)
流动数据 (Nathan邱)
数字图片 (迈克Dickison)
即时认知 (克林特·葛)
35.6参考文献
卡——斯图尔特·K., Mackinlay——乔克·D. 而且 Shneiderman, Ben(编者).) (1999): 信息可视化阅读:用视觉思考. 学术出版社
克利夫兰——威廉·S. (1994): 图表数据的要素. 霍巴特新闻
几, Stephen (2009): 现在你看到了:定量分析的简单可视化技术. 分析新闻
几, Stephen (2004): 给我看数字:设计表格和图形来启发. 分析新闻
哈里斯——罗伯特·L. (2000): 信息图形:一个全面的图解参考. 牛津大学出版社,美国
塔夫特——爱德华·R. (1983): 定量信息的可视化显示. 柴郡,康涅狄格州,图形出版社
制品,科林(2008): 视觉思维:用于设计. 摩根考夫曼