本节书摘来自华章出版社《大数据集成(1)》一书中的第1章,第1.4节,作者 [美] 董欣(xin luna dong)戴夫士·斯里瓦斯塔瓦(divesh srivastava),更多章节内容可以访问云栖社区“华章计算机”公众号查看
本书的后续章节安排如下。在接下来的3章中,我们集中讨论数据集成的3个主要任务。第2章讨论模式对齐,第3章讨论记录链接,第4章讨论数据融合。这些章的结构类似:首先快速介绍传统数据集成中的任务,然后具体描述近年来的文献中如何解决各式各样由海量性、高速性、多样性和真实性带来的大数据集成中的挑战。在第5章,我们概述大数据集成所特有的新出现的研究主题。最后,第6章总结全书。