- 散列机制是如何工作的
- 使用散列容器时怎么样编写hashCode()和equals()方法
- 为什么某些容器会有不同版本的实现, 以及怎么样在他们之间进行选择.
1、 完整的容器分类法
2.、填充容器
Collections.nCopies(Integer num,new Object)&& Collections.fill(List,Object)
都是用单个对象进行复制, fill只能替换已存在的元素, 不能创建新元素
2.1 一种Generator解决方案—— 适配器模式的解决方法
一个CollectionDate类(ArrayList的子类)接收一个Generator和quantity作为参数。 生成quantity大小的CollectionDate。
2.2 Map生成器
和Collection的方式相同。
可以创建任何用于Map或Collection的生成数据集,然后通过构造器或Map.putAll()和Collection.addAll()来初始化Map和Collection。
2.3 使用Abstract类
通过继承Abstract类来创建定制的Map和Collection类。
3、Collection的功能方法
最基本的共性
4.、可选操作
执行各种不同的添加和移除的方法在Collection接口中都是可选操作。
这意味着实现类并不需要为这些方法提供定义。
5、List的功能方法
6、Set和存储顺序
- Set(interface) 存入Set的每个元素都是唯一的,Set不保存重复元素。加入Set的元素必须保证定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。
- HashSet 为了快速查找而设计的Set,存世HashSet的元素必须定义hashCode()
- TreeSet 保持次序的Set,底层为树结构。使用它可以从Set中提取有序的序列,元素必须实现Comparable接口
- LinkedHashSet 具有HashSet的查询速度,且内部使用链表维护元素的顺序,于是在使用迭代器遍历Set时,结果会按照元素插入的次序显示。
7、队列
8、理解Map
- HashMap Map基于散列表的实现。插入和查询键值对的开销是固定的。可以通过构造器设置容量和负载因子,以调整容器的性能。
- LinkedHashMap 类似于HashMap,但是迭代遍历它时,取得键值对的顺序是其插入次序,或者最近最少使用的次序,只比HashMap慢一点点,但是在迭代访问的时候反而更快,因为它使用链表维护内部次序。
- TreeMap 基于红黑树的实现,查看键或键值对时,他们会被排序。所得到的结果是经过排序的,TreeMap是唯一的带有subMap()方法的map,可以返回一个子树。
8.1 性能
HashMap使用了特殊的值,称作散列码。来取代对键的缓慢搜索。
8.2 Sorted map
TreeMap是其现阶段的唯一实现。可以确保键处于排序状态。
- Comparator comparator():返回当前Map用的Comparator。或者返回null,表示以自然方法排序
- T firstKey():返回Map中的第一个键
- T lastKey():返回Map中的最后一个键
- SortedMap subMap(fromKey, toKey)生成此Map的子集 [fromKey,toKey)
- SortedMap headMap(toKey):生成此map的子集,由键小于或等于toKey的所有键值对组成
- SortedMap tailMap(fromKey):生成此Map的子集,由键大于或等于fromKey的所有键值对组成。
8.3 LinkedHashMap
为了提高速度,LinkedHashMap散列化所有元素,但是在遍历键值对时,却又以元素的插入顺序返回键值对。
9、散列与散列码
如果不为你的键覆盖hashCode()和equals(),那么使用散列的数据结构将无法正确处理你的键。
9.1 理解hashCode()
使用散列的目的在于:想要使用一个对象来查找另一个对象。
9.2 为速度而散列
新的map,如果键没有按照任何特定顺序保存,所以只能用最简单的线性查询,而线性查询是最慢的方式。
散列的价值在于速度:散列使得查询得以快速进行。由于瓶颈位于键的查询速度,因此解决方案之一就是保持键的排序状态,然后使用Collections.binarySearch()进行查询。
散列则更进一步,它将键保存在数组,以便很快的找到。
但是数组的尺寸是固定的。所以数组并不保存本身,而是通过键对象生成一个数字,将其作为数组的下标。这个数字就是散列码。由定义在Object中的,且可能由你的类覆盖的hashCode()方法生成。
散列表中的“槽位”通常称为桶位,因此我们将表示实际散列表的数组命名为bucket。
9.3 覆盖hashCode()
设计hashCode()最重要的因素就是:无论何时,对同一个对象调用hashCode()都应该生成同样的值。