天天看点

大数据的具体特点

草稿

4V 就不说了。

网页、日志、数据仓库、广告数据、UGC(BBS, 微博,评论等).

结构化与非结构化并存,系统数据对数据一致性要求强弱程度不同,用户对数据的访问行为存在不确定性,即在毫无征兆的情况下,对某些信息进行突发式访问等。

局部更新,冷热不均,突发性。

数据全局排序,顺序写和随机写的问题。

性能: 高吞吐,低延迟,高并发。

大小: 小记录(KB) VS 大记录(TB)

规模: PB vs TB

数据组织:有序VS 无序,结构化和非结构化

时效性: 实时VS 非实时

一致性: 弱VS强

读写: 易变VS 静态

处理方式: 顺序批量VS 局部随机。

继续阅读