天天看点

《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一2.5 总结

主数据集建模的方式奠定了大数据系统的基础。关于主数据集的决策确定了你可以在数据上执行什么种类的分析以及如何使用这些数据。主数据集的结构必须支持存储数据类型的演变,因为多年来企业的数据类型可能发生大幅改变。

基于事实的模型提供了一个简单而富有表现力的数据表示,随着时间的推移,自然而然地保持了每个行为的完整历史。其“只追加”的特性使得它很容易在分布式系统中实现,并且可以很容易地实现演变数据和适应需求的改变。你不仅以更加可扩展的方式实现了关系型系统,还为系统添加了全新的功能。

继续阅读