从各个地方拼凑的觉得好的笔记:
http://blog.csdn.net/jiaomeng/article/details/1495500
“Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。”
http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html
初始化的时候initialize everything to be 0, 然后选择k个不同的Hash Function.
Bloom-Filter的实现
其实就是有一个bitset. 然后用K个Hash function来map东西到different positions. 只要你这个item的hash值有一个不在bitset上,你就绝对不存在。但是如果全部都在bitsets上,也不能说明说明,因为也许别的String map帮你map到的。
实现From jiuzhang