天天看点

《构建数据湖仓》读书笔记11/18

作者:半页弹
《构建数据湖仓》读书笔记11/18

《构建数据湖仓》(Build the Data Lakehouse)作者比尔·恩门(Bill Inmon),被称为数据仓库之父,最早的数据仓库概念提出者。这本书,是比尔继Building the Data Warehouse”(《建立数据仓库》)又一力作。

本书一共十七章,我将以18篇(加上引言)读书笔记的形式,连续介绍该书的主要内容和观点,敬请关注和参与讨论。

第十章 可视化

本章主要介绍数据可视化的重要性,分析数据可视化、数据分析和数据解释之间的差异。

(1)数据可视化有助于我们利用标准的统计、数值或图形等方法,将特定的数据转化成与之相应的信息,通常采用图形或图片,甚至动画的形式来表示,易于向用户展示底层数据的价值,同时也更易于人们理解。

《构建数据湖仓》读书笔记11/18

(2)缺乏适当可视化的原始数据,就像倾倒在工地上的建筑材料。

《构建数据湖仓》读书笔记11/18

(3)可视化将数据转换为信息,需要识别可用数据、分析数据、关联数据,并从易于终端用户理解的方式将其可视化。

(4)数据可视化、数据分析和数据理解之间的差异

  • 数据分析将收集到的数据有序和结构化,把数据转化为团队能够用于各种用途的信息,包括可视化。数据分析使用系统化的方法,查找不同类型数据之间的趋势、分组或其他关系。
  • 数据可视化是将数据图形化,以便于展示的过程。数据可视化有助于为分析和理解数据提供信息,便于人脑更好的理解和解释;
  • 数据理解(data interpretation)是赋予数据意义的过程。数据解释需要对概括、相关性和因果关系作出结论。
  • 这三个过程通常不是线性的,它们不会按固定的顺序依次发生;
  • 这三个过程相互支持、相互告知(这本书的翻译用词值得商榷)和相互影响。

(5)数据可视化的优点:易于沟通、可赢得关注、带来可信度、令人印象深刻、难忘或易于记忆、信息增强。

《构建数据湖仓》读书笔记11/18
  • 如果您觉得还不错,有所帮助和启发,请点击红星,给个赞;
  • 点击关注,第一时间阅读;
  • ​​欢迎在下方评论区,参与讨论,告诉我们您的想法。