天天看点

如何直观地理解什么是企业数据架构?

作者:小刘老师聊数字化

在数字经济时代浪潮下,几乎每一个开展数字化转型实践的企业都会接触到数据架构的概念。构建、完善和优化企业的数据架构,是数字化转型活动中的核心工作。

在DAMA定义的数据管理框架中,数据架构包括企业数据模型和数据流设计两部分重要内容。本文结合产业应用实践,给出一些更加接近业务实操的形象化解释说明。

数据架构是企业中数据的骨架,有了数据架构,就能清晰地理解企业中的数据,并能用好数据。简单讲,数据架构可以看作是企业中每一条数据的"索引"。

数据架构也是数据治理工作的成果输出。

本来,企业中的数据是混乱的,缺乏有效的组织结构。当有了数据架构,企业中的数据就可以有结构地组织起来,彼此形成业务联系。

此时,数据的消费者可以基于这些联系不断进行数据科学实验,以及相应的数字化业务创新。

如何直观地理解什么是企业数据架构?

打个形象的比方:

数据架构就是企业的数据地图,企业中出现的每一条数据,在数据架构上,都是有据可循的。数据架构把"散沙"状的数据,变成"网络"状的数据,在数据与数据之间构建起联系。

数据架构主要包括:数据模型、数据定义、数据标签体系(针对定性数据)、数据指标体系(针对定量数据)四个方面的内容:

1. 数据模型

数据模型是系统中的数据在"现实域"中的映射。数据模型通过类、关系、实例,描述了数据所表达的业务内涵。

从数据的来源看,数据可以在生产环境和分析环境中。

在生产环境:通常采用"面向过程"的模型,面向过程,就是指,数据存在的意义在于要支持一个特定的业务活动执行完成。

在分析环境:通常采用"面向对象"的模型,面向对象,就是指,数据存在的意义在于要支持围绕特定的业务实体(人、机器、商品、机构)各方面的特征进行综合分析,并从中挖掘出基于该实体有价值的商业洞察。

如何直观地理解什么是企业数据架构?

从模型的抽象层级来看,模型由高到底可以分为,概念模型,逻辑模型,物理模型。

概念模型在内容上相对稳定,对应的通常是企业级的或业务主题级的数据需求。

逻辑模型与具体的数字化应用相关,对应的是项目级的数据需求。

物理模型是数据应用的设计结果产出,是软件系统开发的具体技术参照。

2. 数据定义

数据定义是指,每一项数据都必须要有没有歧义的描述、内涵,以及在系统中的格式约束。

数据的定义需要用"元数据"来进行规范。

元数据包括业务元数据和技术元数据。其中:

业务元数据规范数据在业务域中的内涵,帮助数据消费者准确理解数据含义,高效率地查询和应用企业的数据资源。

技术元数据规范系统中数据如何存储和信息交换,帮助数据库管理人员和软硬件系统的开发人员进行可靠的技术项目实施落地。

3. 标签体系

标签是数据消费者最终关心的业务对象特征,标签与数据的区别在于,标签可以直接提供业务价值。

标签的取值既可以是描述型的也可以是数值型的,也业务应用中,对描述型(表示分类)的标签应用较为广泛。

很多数字化应用的场景就在于为业务实体自动添加标签,并基于标签标注结果,进行相应的定制服务(对外支撑)或业务决策(对内支撑)。

标签的定义来自于前端的具体业务需求。从数据(输入)到标签(输出),可以基于知识规则(专家定义、数据挖掘),也可以基于数据模型(机器学习、深度学习)。

标签之间可以组成标签体系,或标签树,按照主题、实体、场景等不同维度,将标签组织成有层次的群组结构。

如何直观地理解什么是企业数据架构?

4. 指标体系

指标是用来规定业务对象"定量"的数据特征。广义上来看,指标属于标签的特殊类型。

指标与业务系统客观感知、采集到的数据不同,是基于原始数据,通过特定规则(或公式、函数、模型)用机器自动计算而来的。

指标和标签一样,背后有具体的业务需求支撑。指标的定义和计算可以支撑业务进度考核与生产运营监控等不同的数字化需求场景。

此外,指标之间可以组成指标体系。

指标体系和指标相比的应用特点在于,实践中对很多业务对象的评估通常是多维度的,因此,需要基于多个相关的指标对业务对象进行系统、综合、全面的分析。

如何直观地理解什么是企业数据架构?

《大话数字化转型-迎接全行业的数字未来》,2023,

更多数字化精彩内容,欢迎关注微信公众号:大话数字化转型!

作者简介:

刘通(笔名:数字化刘老师),上海交通大学管理科学博士,数易达科技创始人,数字化讲师,自媒体专栏作家,企业数字化咨询师。聚焦于大健康行业,全渠道零售,以及电力产业等领域的数字化转型解决方案。代表作《大话数字化转型》、《AIGC新纪元》。

继续阅读