天天看点

数据治理--元数据--定义

基本定义

在说元数据的定义之前,我们先看下“元”字的意思,在百度百科上可以看到其有“根本、根源”的意思。这样我们引申到元数据就是元数据是数据的根本根源,也就是没有元数据就没有数据。

举例说明

如果仅仅看上面的这个定义可能还不能理解,那我们举个例子。在一个存储客户信息的表中定义了性别字段,其数据类型是varchar,取值范围一般也就有如下几种:male、female、null,三种也就是分别代表男、女、未知。那我们在向这个客户表中维护客户信息时,性别字段也就只能有male,female,null这三种。如果多出来a,b,123这样的数据的话我们就不知道这些值代表了什么含义。所以客户表性别字段的varchar类型、取值范围(male、female、null)就是元数据。

元数据分类

元数据分为业务元数据、技术元数据。如上例所示,性别字段的数据类型是varchar,那这个varchar以及其所属的客户表就是性别字段的技术元数据;取值范围是male,female,null,这些取值范围以及其代表的含义就是业务元数据。当然还有过程元数据一说,我们可以将其归纳到技术元数据范畴当中。