最近校招季,特把自己面试中遇到的问题整理整理,以巩固自己的知识。
Java中对于容器有两大类存储方式,一种是单元素存放,还有一种就是key-value这种有关联的双元素存放了。对于Java中的容器,有下列的结构图可以参照:
Collection (用来存放独立元素的序列)
├List
│├LinkedList
│├ArrayList
│└Vector
│ └Stack
└Set
├HashSet
└TreeSet
Map (用来存放key-value型的元素对)
├Hashtable
├HashMap
├TreeMap
└WeakHashMap
下面,我们就来分别讲讲这几种容器。
List
List是有序的Collection,使用此接口能控制每个元素插入的位置,用户能够使用索引来访问元素。与Set不同的是,List允许有重复的元素在其中。
-
ArrayList
ArrayList相当于顺式存储(线性表),当实例化一个ArrayList时,一个数组也被实例化了,默认初始化一个长度为10的数组。当添加数据的时候会判断当前容量是否能够容下新增的对象,一旦发现容量不足,会自动扩容,新的大小为原有容量的1.5倍+1。ArrayList可以快速随机访问,通过调用get(i)方法来访问下标为i的元素。
-
LindedList
LinkedList相当于链式存储(双向链表),它是通过节点直接彼此连接来实现的。每一个节点都包括前一个节点的引用,后一个节点的引用和节点存储的值。
当插入或删除节点时,只需要修改其中保持先后关系的节点的引用即可,所以,操作其中的对象速度比ArrayList要快的多。但是LinkedList不能随机访问元素,虽然它有get()方法,但是这个方法是通过遍历节点来定位的,速度很慢。
-
Vector
Vector和ArrayList一样,也是用数组来存储元素。但是Vector使用了synchronized方法,线程安全,所以在性能上比ArrayList要差。
ArrayList和LinkedList的区别
- ArrayList实现了基于动态数组的数据结构,LinkedList实现了基于链表的数据结构
- 对于随机访问get和set,ArrayList优于LinkedList
- 对于增删add和remove,LinkedList优于ArrayList
Set
Set是一种不包含重复元素的Collection,它的构造函数有一个约束条件,传入的Collection参数不能包含重复的元素。
-
HashSet
HashSet实现了Set接口,由哈希表支持。它不保证Set的迭代顺序,特别是它不保证该顺序恒久不变。HashSet底层使用的容器实际上就是HashMap,它以HashMap的key来保存所有的元素,value使用一个static final的Object对象来标识。
private static final Object PRESENT = new Object();
-
TreeSet
TreeSet整体上性能没有HashSet好,但是它可以维持元素的排序状态。TreeSet底层使用的容器实际上就是TreeMap,它以TreeMap的key来保存set集合的元素,value都以一个名为PRESENT的Object对象代替(无实际意义)。
Map
Map接口提供key到value的映射,一个Map不能包含相同的key,每个key只能映射一个value。
HashMap
HashMap底层就是一个数组结构,数组中的每一项又是一个链表(其实就是哈希表的拉链法实现)。但是此类不保证映射的顺序,特别是不保证该顺序恒久不变。但是TreeMap可以维持映射的顺序。Hashtable
和HashMap实现差不多,具体区别见下面的Hashtable和HashMap的区别。-
TreeMap
TreeMap的底层实现是一个红黑树结构,这样可以保证快速检索节点,TreeMap可以维持映射的顺序。下面我们来具体说下TreeMap的底层实现,首先我们需要了解下排序二叉树:
- 排序二叉树:要么是一棵空二叉树,要么是具有下列性质的二叉树:
- 若它的左子树不为空,则左子树上所有节点的值均小于根节点的值
- 若它的右子树不为空,则右子树上所有节点的值均大于根节点的值
- 它的左右自子树也分别为排序二叉树
对于排序二叉树,它的中序遍历就可以得到由小到大的有序序列,所以用它就可以实现快速检索,但是为什么Java还要多此一举用红黑树呢?
- 排序二叉树虽然可以快速检索,但是在最坏情况下:若插入的节点本身就是有序的,要么由小到大排列,要么由大到小排列,那么最后得到的排序二叉树就变为了链表:所有的节点只有左节点或者所有的节点只有右节点。这种情况下,排序二叉树就变为了普通链表,检索效率会很差。
所以,Java引入了红黑树作为TreeMap的底层实现
-
红黑树:红黑树是一种更高效的检索二叉树,它的性质为:
- 所有的节点都为红色或者黑色
- 根节点永远是黑色
- 所有的叶节点都是空节点(NULL),并且是黑色
- 每个红色节点的两个子节点都是黑色,即从根节点到叶子节点的路径上不会出现两个连续的红色节点。
- 从任一节点到其子树中每个叶子节点的路径都包含相同数量的黑色节点
红黑树通过上面的限制来保证它大致是平衡的(因为红黑树的高度不会无限增高),这样保证了红黑树在最坏情况下都是高效的,不会出现普通排序二叉树的情况。
- 排序二叉树:要么是一棵空二叉树,要么是具有下列性质的二叉树:
Hashtable和HashMap的区别
继承和实现不同
Hashtable是继承自陈旧的Dictionary类,实现了Map接口;HashMap实现接口(继承自AbstractMap,AbstractMap实现Map接口)线程安全不同
Hashtable是线程安全的,它的实现方法里面都添加了synchronized关键字来确保线程同步。HashMap是线程不安全的,在多线程编程下如使用HashMap需要使用Collections.synchronizedMap()来获取一个线程安全的集合。对null的处理不同
HashMap支持null作为key和value,但是Hashtable不允许(key,value都不允许)。HashMap的方法get()返回null时,既可以表示没有改键,也可以表示该键对应的值为null,所以不能用此判断是否有该键,而应该用containsKey()。HashMap初始容量为16,Hashtable初始容量为11。HashMap扩容时是当前容量翻倍:capacity2,Hashtable是当前容量翻倍+1:capacity2+1。
哈希值的使用不同
Hashtable直接使用key的hashcode对table数组的长度取模,HashMap是对key的hashcode进行二次hash,然后对table数组的长度取模,以获得更好的散列值。