布隆过滤器

(本文全部由AI生成)

布隆过滤器：用少量空间实现高效存在性检查

过滤器.png

相当于位运算，0 1 存储节省空间

什么是布隆过滤器？

布隆过滤器（Bloom Filter）是一种巧妙的空间效率型概率数据结构，它能以极小的内存开销告诉你：

确定不存在（100%准确）
可能存在（有较小误判概率）

核心特性

✅ 超高的空间效率
✅ 常数时间查询
❌ 不支持元素删除
❌ 存在误判可能（可通过参数配置）

底层原理揭秘

三大核心组件

位数组：初始化全0的二进制数组
哈希函数簇：多个独立的哈希函数
操作机制：
- 添加：通过哈希函数将元素映射到多个位点并置1
- 查询：检查所有对应位点是否均为1

数学关系

误判率 p 与参数关系：

p ≈ (1 - e^(-k*n/m))^k

其中：

m：位数组大小
k：哈希函数数量
n：已插入元素数量

典型应用场景

数据库查询优化 - 先查布隆过滤器减少无效IO
缓存穿透防护 - 拦截不存在key的请求
爬虫去重系统 - 快速判断URL是否已抓取
垃圾邮件过滤 - 快速识别已知垃圾邮件地址

Go语言实现示例

package main

import (
    "hash/fnv"
    "math"
)

type BloomFilter struct {
    bitset []bool      // 位数组
    hashes []func(string) uint32  // 哈希函数集合
}

func NewBloomFilter(size uint, hashCount uint) *BloomFilter {
    bf := &BloomFilter{
        bitset: make([]bool, size),
        hashes: make([]func(string) uint32, hashCount),
    }

    // 初始化哈希函数（示例使用两种哈希组合）
    for i := range bf.hashes {
        seed := uint32(i + 1)
        bf.hashes[i] = func(s string) uint32 {
            h := fnv.New32a()
            h.Write([]byte(s))
            return h.Sum32() * seed
        }
    }
    return bf
}

func (bf *BloomFilter) Add(item string) {
    for _, hash := range bf.hashes {
        index := hash(item) % uint32(len(bf.bitset))
        bf.bitset[index] = true
    }
}

func (bf *BloomFilter) Contains(item string) bool {
    for _, hash := range bf.hashes {
        index := hash(item) % uint32(len(bf.bitset))
        if !bf.bitset[index] {
            return false
        }
    }
    return true
}

// 使用示例
func main() {
    bf := NewBloomFilter(1000, 3)
    bf.Add("https://example.com/user1")
    bf.Add("https://example.com/user2")

    fmt.Println(bf.Contains("https://example.com/user1")) // true
    fmt.Println(bf.Contains("https://example.com/user3")) // false（可能误判）
}

Redis 支持布隆过滤器

Redis 提供了布隆过滤器的支持，可以通过 Redisson 客户端在 Redis 中实现高效的快速查找和去重功能。以下是一个基于 Redis 的布隆过滤器的 Golang 实现示例：

package main

import (
    "fmt"
    "github.com/go-redis/redis/v8"
    "golang.org/x/exp/slices"
    "context"
    "time"
)

var ctx = context.Background()

func main() {
    client := redis.NewClient(&redis.Options{
        Addr:     "localhost:6379",
        Password: "", // no password set
        DB:       0,  // use default DB
    })

    // 初始化布隆过滤器
    _, err := client.BFReserve(ctx, "myBloomFilter", 0.01, 1000).Result()
    if err != nil {
        panic(err)
    }

    // 添加元素
    _, err = client.BFAdd(ctx, "myBloomFilter", "example").Result()
    if err != nil {
        panic(err)
    }

    // 检查元素是否存在
    exists, err := client.BFExists(ctx, "myBloomFilter", "example").Result()
    if err != nil {
        panic(err)
    }
    fmt.Println("example exists:", exists) // 输出：example exists: 1

    exists, err = client.BFExists(ctx, "myBloomFilter", "test").Result()
    if err != nil {
        panic(err)
    }
    fmt.Println("test exists:", exists) // 输出：test exists: 0
}

生产环境注意事项

误判率权衡：根据业务需求选择合适错误率（通常0.1%-1%）
容量规划：预估元素数量，避免频繁扩容
哈希函数选择：推荐使用MurmurHash等高效算法
不支持删除：考虑Counting Bloom Filter变种
性能考量：Redis版吞吐量可达10万+/秒

总结

布隆过滤器是解决海量数据存在性检查问题的利器，合理使用时能显著提升系统性能。结合Redis的实现方案，更可以轻松应对分布式场景下的高并发挑战。使用时注意根据业务特点调整参数，做好容量规划，就能在有限资源下获得最佳效果！

最后编辑于：2025.02.12 14:26:07

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,607评论 6赞 507
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,239评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,960评论 0赞 355
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,750评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,764评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,604评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,347评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,253评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,702评论 1赞 315
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,893评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,015评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,734评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,352评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,934评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,052评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,216评论 3赞 371
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,969评论 2赞 355