天天看点

数据可视化图表总结(二)

目录

​​一、热图​​

​​二、散点图​​

​​三、气泡图​​

​​四、气泡地形图​​

​​五、地区分布图​​

​​六、点示地图​​

​​七、连接地图​​

​​八、流向地图 ​​

​​九、甘特图​​

​​十、箱型图​​

​​ 十一、子弹图​​

​​十二、蜡烛图​​

​​十三、跨度图​​

​​十四、卡吉图 ​​

​​十五、美国线​​

​​十六、炫图​​

​​十七、非彩带炫图 ​​

​​十八、树形图 ​​

​​十九、流程图​​

​​二十、脑力激荡图 ​​

​​二十一、记数符号图表 ​​

​​二十二、日历图 ​​

​​二十三、时间线 ​​

​​二十四、时间表​​

​​二十五、象形图 ​​

​​二十六、茎叶图 ​​

​​二十七、文氏图 ​​

​​ 二十八、小提琴图​​

​​二十九、字云图 ​​

一、热图

        热图 (Heatmap) 通过色彩变化来显示数据,当应用在表格时,热图适合用来交叉检查多变量的数据。

        热图适用于显示多个变量之间的差异;显示当中任何模式;显示是否有彼此相似的变量;以及检测彼此之间是否存在任何相关性。

        由于热图依赖颜色来表达数值,它比较适合用来显示广泛数值数据,因为要准确地指出色调之间的差异始终有难度,也较难从中提取特定数据点(除非在单元格中加入原始数据)。

数据可视化图表总结(二)

二、散点图

        散点图 (Scatterplot) 也称为「点图」、「散布图」或「X-Y 点图」,用来显示两个变量的数值(每个轴上显示一个变量),并检测两个变量之间的关系或相关性是否存在。     

        图表中可加入直线或曲线来辅助分析,并显示当所有数据点凝聚成单行时的模样,通常称为「最佳拟合线」或「趋势线」。

        如您有一对数值数据,可使用散点图来查看其中一个变量是否在影响着另一个变量。可是请记住,相关性并非因果关系,也有可能存在另一个变量在影响着结果。

数据可视化图表总结(二)

三、气泡图

        气泡图是一种包含多个变量的图表,结合了散点图和比例面积图,圆圈大小需要按照圆的面积来绘制,而非其半径或直径。

        通过利用定位和比例,气泡图通常用来比较和显示已标记/已分类的圆圈之间的关系。

        可是,过多气泡会使图表难以阅读,但我们可以在图表中加入交互性功能来解决这个问题(点击或把鼠标悬停在气泡上以显示隐藏信息),也可选择重组或筛选分组类别。

数据可视化图表总结(二)

四、气泡地形图

        在这种数据地图中,指定地理区域上方会显示圆形图案,圆形面积与其在数据集中的数值会成正比。

        气泡地图适合用来比较不同地理区域之间的比例,而不会受区域面积的影响。但气泡地图的主要缺点在于:过大的气泡可能会与地图上其他气泡或区域出现重迭。

数据可视化图表总结(二)

五、地区分布图

        地区分布图通常用来显示不同区域与数据变量之间的关系,并把所显示位置的数值变化或模式进行可视化处理

        我们在地图上每个区域以不同深浅度的颜色表示数据变量,例如从一种颜色渐变成另一种颜色、单色调渐进、从透明到不透明、从光到暗,甚至动用整个色谱。

        但缺点是无法准确读取或比较地图中的数值。此外,较大的地区会比较小区域更加显眼,影响读者对数值的感知。

        绘制地区分布图时的常见错误:对原始数据值(例如人口)进行运算,而不是使用归一化值(例:计算每平方公里的人口)。

数据可视化图表总结(二)

六、点示地图

        点示地图 (Dot Map) 也称为「点示分布图」或「点示密度图」。在地理区域上放置相等大小的圆点,旨在检测该地域上的空间布局或数据分布。

        点示地图共有两种:一对一(每点代表单一计数或一件物件)和一对多(每点表示一个特定单位,例如 1 点 = 10棵树)。

        点示地图非常适合用来查看物件在某地域内的分布状况和模式,而且容易掌握,能提供数据概览。

数据可视化图表总结(二)

七、连接地图

        连接地图 (Connection Map) 是用直线或曲线连接地图上不同地点的一种图表。

        连接地图非常适合用来显示地理连接和关系,也可以通过研究连接地图上的连接分布或集中程度来显示空间格局。

八、流向地图 

        流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置的移动及其数量,通常用来显示人物、动物和产品的迁移数据。

        单一流向线所代表的移动规模或数量由其粗幼度表示,有助显示迁移活动的地理分布。

数据可视化图表总结(二)

九、甘特图

        甘特图 (Gantt Chart) 通常用作项目管理的组织工具,显示活动(或任务)列表和持续时间,也显示每项活动何时开始和结束。

        甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭的活动。

数据可视化图表总结(二)

十、箱型图

        箱形图又称为「盒须图」或「箱线图」,能方便显示数字数据组的四分位数,可以垂直或水平的形式出现。

        从盒子两端延伸出来的线条称为「晶须」(whiskers),用来表示上、下四分位数以外的变量。异常值 (Outliers) 有时会以与晶须处于同一水平的单一数据点表示

        箱形图通常用于描述性统计,是以图形方式快速查看一个或多个数据集的好方法。

数据可视化图表总结(二)

 十一、子弹图

        子弹图 (Bullet Graph) 的功能类似于条形图,但加入更多视像元素,提供更多补充信息。

        子弹图最初由 Stephen Few 开发,用来取代仪表盘上如里程表或时速表这类图形仪表,解决显示信息不足的问题,而且能有效节省空间,更可除掉仪表盘上一些不必要的东西。

数据可视化图表总结(二)

十二、蜡烛图

        又名「日本K线图」,通常用来显示和分析证券、衍生工具、外汇货币、股票、债券等商品随着时间的价格变动。

        蜡烛图通过使用烛台式的符号来显示多种价格信息,例如开盘价、收盘价、最高价和最低价,每个代表单一时间段(每分钟、每小时、每天或每月)的交易活动。每个烛台符号沿着 X 轴上的时间刻度绘制,显示随着时间推移的交易活动。

        但是,蜡烛图只能显示开盘价和收盘价之间的关系,而非两者之间所发生的事件,因此也无法用来解释交易波动的缘由。

数据可视化图表总结(二)

十三、跨度图

        也称为「范围条形/柱形图」或「浮动条形图」,用来显示数据集内最小值和最大值之间的范围,适合用来比较范围,尤其是已分类的范围。

        跨度图只集中显示极端数值,不提供任何关于最小值和最大值之间的数值、整体平均值或数据分布等其他信息。

数据可视化图表总结(二)

十四、卡吉图 

        卡吉图 (Kagi Chart)能通过一系列线段显示价格表现,进而显示特定资产的一般供需水平。由于与时间无直接关系,它能更清晰地显示重要的价格走势。

数据可视化图表总结(二)

十五、美国线

        美国线 (Open-high-low-close Charts) 也称为「OHLC 图」或「价格图」,通常用作交易工具,显示和分析证券、货币、股票、债券等商品随时间的价格变动。

数据可视化图表总结(二)

十六、炫图

        弦图 (Chord Diagram) 可以显示不同实体之间的相互关系和彼此共享的一些共通之处,因此这种图表非常适合用来比较数据集或不同数据组之间的相似性。

        节点围绕着圆周分布,点与点之间以弧线或贝塞尔曲线彼此连接以显示当中关系,然后通过每个圆弧的大小比例再给每个连接分配数值。此外,也可以用颜色将数据分成不同类别,有助于进行比较和区分。

数据可视化图表总结(二)

十七、非彩带炫图 

        非彩带弦图 (Non-ribbon Chord Diagram) 是弦图的一个精简版本,仅显示节点和连接线,更加强调数据之间的连接关系

数据可视化图表总结(二)

十八、树形图 

        树形图 (Tree Diagram) 也称为「组织图」或「链路图」,是通过树状结构表示层次结构的一种方式。

        其结构通常由没有上级/父级成员的元素开始(根节点),然后加入节点,再用线连在一起,称为分支,表示成员之间的关系和连接。最后是枝叶节点(或称为末端节点),是没有子节点的成员。

        树形图通常用于表示家庭关系和血统、分类学、进化科学、计算机科学与数学等,也是企业和组织的管理工具

数据可视化图表总结(二)

十九、流程图

        流程图 (Flow Chart) 使用一系列相互连接的符号绘制出整个过程,从而解释复杂和/或抽象的过程、系统、概念或算法的运作模式。

        不同符号代表不同意思,每种都具有各自的特定形状。流程图以弧形矩形表示流程的开始和结束;线段或箭头用于显示从一个步骤到另一个步骤的方向或流程;简单的指令或动作用矩形来表示,而当需要作出决定时,则使用钻石形状...

数据可视化图表总结(二)

二十、脑力激荡图 

        脑力激荡图也称为「心智图」,可以将相关想法、单词、图像和概念联合在一起。

        脑力激荡图经常在项目初期使用,用来产生想法、查找关联、分类想法、组织信息、显示结构和一般学习。

数据可视化图表总结(二)

二十一、记数符号图表 

        记数符号图表 (Tally Chart) 既是记录工具,也可通过使用标记数字系统来显示数据分布频率。

        在绘制记数符号图表时,将类别、数值或间隔放置在同一个轴或列(通常为 Y 轴或左侧第一列)上。每当出现数值时,在相应的列或行中添加记数符号。

        完成收集所有数据后,把所有标记加起来并把总数写在下一列或下一行中,最终结果类似于直方图。

数据可视化图表总结(二)

二十二、日历图 

        人类曾开发出各种日历系统作为组织工具,帮助我们提前做好计划。我们也把日历当作可视化工具,适用于显示不同时间段的活动事件的组织情况。

        今天我们最常用的日历形式是公历,每个月份的月历由七个垂直列组成(代表每周七天),另有约五至六行以水平方式代表星期。

        可是,日历格式并没有严格规定,所以市面上有各式各样不同的设计,只要能以时间顺序显示日期或时间单位便可。

数据可视化图表总结(二)

二十三、时间线 

        时间线 (Timeline) 是以时间顺序显示一系列事件的图象化方式,主要功能是传达时间相关信息,用于分析或呈现历史故事。

        如果是按比例绘制的时间线,我们可以通过查看不同事件之间的时间间隔,了解事件发生的时间或即将在何时发生,从中查找时间段内的事件是否遵循任何模式,或者事件在该时间段内如何分布。

        有时时间线会与图表相互结合,显示定量数据随时间的变化。

数据可视化图表总结(二)

二十四、时间表

        时间表 (Timetable) 可用作预定事件、任务和行动的引用和管理工具。

        使用表格按时间顺序和/或字母顺序组织数据,能有助用户快速进行引用。

数据可视化图表总结(二)

二十五、象形图 

        说明图旨在使用笔记、标签和图例来解释说明所显示的图像,以便解释概念或方法、描述物件或场所、显示事情的运作变化或帮助了解所显示的主题。

        所使用的图像可以是象征性、图像化或真实相片。

数据可视化图表总结(二)

二十六、茎叶图 

        茎叶图 (Stem & Leaf Plots) 又称为「枝叶图」,是一种按位数 (place value)组织数据的方法,可用来显示数据分布。

        不变的位数由小至大、由上至下显示在中间的「茎」(通常是以十为单位),每个位数之内的数据则会成为「叶」并横向延伸。

        除了向读者快速提供数据分布信息之外,茎叶图也可用于突出异常值和查找模式。如果您有两个数据集,则可使用背对背或双重茎叶图来比较两者。

数据可视化图表总结(二)

二十七、文氏图 

        文氏图 (Venn Diagram) 也称为「集合图」,显示集与集之间所有可能存在的逻辑关系,每个集通常以一个圆圈表示。

        每个集都是一组具有共同之处的物件或数据,当多个圆圈(集)相互重迭时,称为交集 (intersection),里面的数据同时具有重迭集中的所有属性。

数据可视化图表总结(二)

 二十八、小提琴图

        小提琴图 (Violin Plot) 结合了箱形图和密度图的特征,主要用来显示数据的分布形状。

        中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中位数。

数据可视化图表总结(二)

二十九、字云图 

        字云图 (Word Cloud) 也称为「标签云图」、「词云」等,每个此的大小与其出现频率成正比,以此显示不同单词在给定文本中的出现频率,然后将所有的字词排在一起,形成云状图案。

        在字云图上使用颜色通常都是毫无意义的,主要是为了美观,但我们可以用颜色对单词进行分类。