这是我参与「第四届青训营 」笔记创造活动的的第14天
课程材料
课程链接:live./4354/yc_vis…
课程PPT:bytedance.feishu.cn/file/boxcnh…
学员手册:/post/713013…
完好手册:bytedance.feishu.cn/docx/doxcnE…
一、界说
什么是数据可视化
在科学可视化范畴,数据可视化的作用主要是形象化的出现,方便人们了解和检查。比方医学范畴的扫描成像,能够大大提高医师探寻病因的功率。
出现数据关系的信息可视化是咱们见到最多的可视化办法,比方经过地理信息以及连线展示唐代人物的迁徙轨道。
在计算机诞生之前,可视化都是静态作品,人们只能经过看来了解数据。跟着计算机图形的发展,交互成为一个重要研讨方向,可视化和图形交互的交融,产生了探究式数据剖析。比方下面的数据剖析东西Tableau的交互界面。
二、原理
2.1 数据可视化基本流程
第一步 : 数据处理( Abstract Data ) 只要满意特定结构的数据才干做对应的可视化展示,并且为了到达好的可视化作用也需求对数据进行清洗、转化等操作。
第二步 : 可视化设计与表达( Visualization Design) 依据数据特征选择适宜的展示形式,在此基础上经过合理的运用视觉编码,来界说最终的可视化展示内容。
第三步:可视化烘托( Rendering and Display)
将界说好的图形转化成为图像,展示给观众。
第四步:可视化交互( Interactivity)
单一的可视化成果并不能满意用户的多方面诉求,用户往往凭借交互办法,进一步了解细节或者对数据进行筛选、聚合、分面等,对数据进行多方面的探究。
三、事例
人们直接去剖析多维数据,往往是非常困难的,凭借可视化能够极大的提升功率。对多维数据进行可视化的办法也许多,这里简单介绍几种。
3.1 散点图 & 散点图矩阵
一般散点图能够经过巨细、颜色和方位表达三个维度的数据,但是这关于更多维的数据来讲是远远不够的,所以诞生了散点图矩阵。
散点图矩阵中每个散点图表明两个维度之间的数据关系。咱们看下面的比如(www.jiqizhixin.com/articles/20…
假定有如下图所示的数据:
每一行代表一个国家一年的观察数据,列代表变量(这种格局的数据被称作整洁数据,tidy data),其中有两个类别列(国家和洲)和四个数值列。这些列简单易懂:life_exp 是出世时的预期寿命,以年为单位,popis 是人口数量,gdp_per_cap 是人均 GDP(以国际元)为单位。只考虑数值类型属性之间的关系, 可生成如下的散点图矩阵:
散点图矩阵能够进一步扩展为一般的矩阵,如下图:
3.2 平行坐标轴
平行坐标轴办法中,数据的不同维度被显现为平行的坐标轴,数据元素被表明为一根折线。
这种办法适用于所有表格类型的数据,并且支持异构数据的展示。平行坐标轴办法也扩展出多种显现形式。
3.3 Glyph
Glyph 是能够一起运用多个视觉通道,例如 图形(shape)、颜色(colour)、文本(texture)、巨细(size)、视点(orientation)、份额(aspect ratio)、曲率(curvature)的一种组合图元。一起每个glyph 能够独自被识别出来,为多场交融可视化提供了或许。
比方人脸图,能够经过五官要素对多个变量进行编码。
下图的是一个温度计组件。水银高度和温度计宽度能够用来展示两个变量。通常能够作为散点图的变种。
3.4 树(图)可视化
点线图
邻接图
经过可视化节点之间的相邻方位关系以展示树的拓扑结构,节点的巨细,宽度,能够用来展示别的一个数据维度。
包含图
邻接矩阵