hbase-bloom filter

2023-02-16 07:02:23

bloom fliter的作用主要用于提升hbase的读性能，但是会牺牲一定的存储空间。

原理：

bloom fliter是一种空间效率很高的随机数据结构，初始状态时，bloom filter是一个包含m位的位数组（值为0），当有元素写入时，通过k个hash函数将这个元素映到这个位数组中，映射的位置设置为1。当判断一个元素是否存在时，用同样的方式进行映射，当映射的位置在这个位数组的值全部为1时，则认为该元素是存在的。

举例：

假设将x，y，z三个关键信息存入表中，判断w是否存在。

写入数据。x，y，z存入时，通过hash函数获得对应的位向量，写入到位数组中。
查找数据。对w同样进行hash函数获取对应的位向量，判断位数组中对应的位置是否全为1
如果是，则表明w存在表中
如果不是，则表明w不存在表中

hbase-bloom filter

create 'test_table',{NAME=>'test_col_family',VERSIONS=>1,BLOCKCACHE=>true,BLOOMFILTER=>'ROW',COMPRESSION=>'SNAPPY',TTL => ' 259200 '},{SPLITS => ['1','2','3','4','5','6','7','8','9','a','b','c','d','e','f']}

hbase在创建表时，可以通过BLOOMFILTER参数配置bloom fliter，可选的值有NONE|ROW|ROWCOL三种，默认为NONE，即不开启bloom filter，ROW为对行过滤，ROWCOL为根据行和列簇进行过滤。启用bloom filter，在get和scan的操作过程中，可以筛选过滤一部分hfile，减少io开销，从而提升查询性能。

转载于:https://www.cnblogs.com/cnblog-ycc/p/9869111.html

hbase-bloom filter

原理：

举例：

继续阅读

苹果公司给中国交税吗？网友:不仅交，还是A级

苹果官方旗舰店天猫618特惠：iPhone 15系列至高优惠2300元

苹果拼了！iPhone 15官旗降至第三方渠道价：同样价格买苹果还是华为小米

在华祭出史上最大降价，苹果真急了

苹果加入“618价格战”，开卖1小时成交超15亿！iPhone 15系列最高优惠超2000元，系史上最大降价

iPhone 15系列至高优惠2300！苹果旗舰店天猫618政策公布

淘宝天猫618上线苹果,华为,小米等100个「王炸全家桶」今晚8点现货开卖

为什么越来越多的年轻人选择华为而不选择苹果手机呢？

苹果手机32个隐藏功能

操盘必读丨比特币突破7万美元，金银铜集体飙升；苹果最大降价来了

知名机构突然爆雷，坑惨无数家长；苹果重磅！5月20日起大降价…

微软向苹果开火！AI PC全家桶装上GPT-4o，AI实时聊天教你打游戏

苹果慌了！iPhone 15 Pro直降2000元

新iPad Pro惨遭苹果官方阉割 8GB机型实则搭载12GB内存

苹果换购计划升级：旧iPhone回收价上涨优惠至6月3日

最高优惠2300元！苹果在中国宣布史上最大降价