很简单却能让你面试头疼得 Java 容器，这里从源码给你解释清楚-CFANZ编程社区

之前在整理Redis的五大数据结构的时候，其中提到了list、set等知识点的时候，就想起来刚上大学那会的青涩时光，抱着一本Java生啃得时候得傻样，跟女朋友交流的时候，她说那你怎么不也顺便整理一下啊，自己也回想以下那个时候咱俩谈恋爱你让我在机房等你的时候，哼！（ps：我闲的没啥事提这茬干啥啊，先去哄一下再回来继续写啊）

。。。

哄好了，回来继续写，翻出来那个时候整理的笔记，这是我做的思维导图（当时我的导师要求我做的，我感谢他培养了我这个习惯），正好在这里当作目录使用了(后面讲解得时候，我会展开展示)

个人公众号：Java架构师联盟，每日更新技术好文

在学Java以前，一说到存放东西，第一个想到的就是使用数组，使用数组，在数据的存取方面的却也挺方便，其存储效率高访问快，但是它也受到了一些限制，比如说数组的长度以及数组的类型，当我需要一组string类型数据的同时还需要Integer类型的话，就需要定义两次，同时，数组长度也受到限制，即使是动态定义数组长度，但是长度依然需要固定在某一个范围内，不方便也不灵活。

如果说我想要消除上面的这个限制和不方便应该怎么办呢？Java是否提供了相应的解决方法。答案是肯定的，这就是Java容器，java容器是javaAPI所提供的一系列类的实例，用于在程序中存放对象，主要位于Java.util包中，其长度不受限制，类型不受限制，你在存放String类的时候依然能够存放Integer类，两者不会冲突。

容器API类图结果如下所示：

Collection接口

Collection是最基本的集合接口，一个Collection代表一组Object，即Collection的元素。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接继承自Collection的类，Java SDK提供的类都是继承自Collection的“子接口”如List和Set。

举例：

import java.util.*;

public class TestA{

public static void main(String[] args)

{

Collection lstcoll=new ArrayList();

lstcoll.add("China");

lstcoll.add(new String("ZD"));

System.out.println("size="+lstcoll.size());

System.out.println(lstcoll);

}

结果：

List接口

List是有序的Collection，使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引（元素在List中的位置，类似于数组下标）来访问List中的元素，也就是说它是有顺序的，类似于Java的数组。和Set不同，List允许有相同的元素。J2SDK所提供的List容器类有ArrayList、LinkedList等。

实例：

import java.util.*;

public class TestB{

public static void main(String[] args)

{

List l1=new LinkedList();

for(int i=0;i<=5;i++){

l1.add("a"+i);

}

System.out.println(l1);

l1.add(3,"a100");

System.out.println(l1);

l1.set(6,"a200");

System.out.println(l1);

System.out.println((String)l1.get(2)+" ");

l1.remove(1);

System.out.println(l1);

}

运行结果：

ArrayList

ArrayList其实就相当于顺式存储，它包装了一个数组 Object[]，当实例化一个ArrayList时，一个数组也被实例化，当向ArrayList中添加对象时，数组的大小也相应的改变。这样就带来以下有特点：快速随即访问，你可以随即访问每个元素而不用考虑性能问题，通过调用get(i)方法来访问下标为i的数组元素。向其中添加对象速度慢，当你创建数组时并不能确定其容量，所以当改变这个数组时就必须在内存中做很多事情。操作其中对象的速度慢，当你要向数组中任意两个元素中间添加对象时，数组需要移动所有后面的对象。

下面我们来看一下源码级实际操作

基于数组，支持快速随机访问

public class ArrayList<E> extends AbstractList<E>

implements List<E>, RandomAccess, Cloneable, java.io.Serializable // 实现了RandomAccess表示支持快速随机访问

数组默认大小为10，基于数组实现

private static final int DEFAULT_CAPACITY = 10;

transient Object[] elementData; // non-private to simplify nested class access

添加元素时会调用add（）方法，同时使用ensureCapacityInternal（）方法来保证调用add（）方法时数组的容量，当数组容量不够时，会调用grow（）方法进行扩容。

扩容代码：

private void grow(int minCapacity) {

// overflow-conscious code

int oldCapacity = elementData.length;

int newCapacity = oldCapacity + (oldCapacity >> 1); // 扩容大小为原来的1.5倍

　　　　　 ......

// minCapacity is usually close to size, so this is a win:

elementData = Arrays.copyOf(elementData, newCapacity); // 将原来的数组拷贝进新的数组，扩容的代价高

}

删除元素是会调用system.arraycopy()方法，将index+1后面的元素都复制到index的位置上，代价高

System.arraycopy(elementData, index+1, elementData, index, numMoved);

LinkedList

LinkedList相当于链式存储，它是通过节点直接彼此连接来实现的。每一个节点都包含前一个节点的引用，后一个节点的引用和节点存储的值。当一个新节点插入时，只需要修改其中保持先后关系的节点的引用即可，当删除记录时也一样。这样就带来以下特点：操作其中对象的速度快，只需要改变连接，新的节点可以在内存中的任何地方。不能随即访问，虽然存在get()方法，但是这个方法是通过遍历接点来定位的，所以速度慢。

代码实现

private static class Node<E> {

E item;

Node<E> next;

Node<E> prev;

Node(Node<E> prev, E element, Node<E> next) {

this.item = element;

this.next = next;

this.prev = prev;

}

Set接口

Set是一种不包含重复的元素的Collection，即任意的两个元素e1和e2都有e1.equals(e2)=false，Set最多有一个null元素。 Set的构造函数有一个约束条件，传入的Collection参数不能包含重复的元素。

Set容器类主要有HashSet和TreeSet等。

HashSet

此类实现 Set 接口，由哈希表（实际上是一个 HashMap 实例）支持。它不保证 set 的迭代顺序；特别是它不保证该顺序恒久不变。此类允许使用 null 元素。

举例：

import java.util.*;

public class TestC{

public static void main(String[] args)

{

Set s=new HashSet();

s.add("Hello");

//相同元素

s.add("Hello");

System.out.println(s);

}

结果：

treeset

TreeSet是一个有序的集合，它的作用是提供有序的Set集合。它继承了AbstractSet抽象类，实现了NavigableSet<E>，Cloneable，Serializable接口。TreeSet是基于TreeMap实现的，TreeSet的元素支持2种排序方式：自然排序或者根据提供的Comparator进行排序。

实例

public static void demoOne() {

TreeSet<Person> ts = new TreeSet<>();

ts.add(new Person("张三", 11));

ts.add(new Person("李四", 12));

ts.add(new Person("王五", 15));

ts.add(new Person("赵六", 21));

System.out.println(ts);

}

执行结果：会抛出一个异常：java.lang.ClassCastException显然是出现了类型转换异常。原因在于我们需要告诉TreeSet如何来进行比较元素，如果不指定，就会抛出这个异常

如何解决：如何指定比较的规则，需要在自定义类(Person)中实现Comparable接口，并重写接口中的compareTo方法

public class Person implements Comparable<Person> {

private String name;

private int age;

...

public int compareTo(Person o) {

return 0; //当compareTo方法返回0的时候集合中只有一个元素

return 1; //当compareTo方法返回正数的时候集合会怎么存就怎么取

return -1; //当compareTo方法返回负数的时候集合会倒序存储

}

为什么返回0，只会存一个元素，返回-1会倒序存储，返回1会怎么存就怎么取呢？原因在于TreeSet底层其实是一个二叉树机构，且每插入一个新元素(第一个除外)都会调用compareTo()方法去和上一个插入的元素作比较，并按二叉树的结构进行排列。

如果将compareTo()返回值写死为0，元素值每次比较，都认为是相同的元素，这时就不再向TreeSet中插入除第一个外的新元素。所以TreeSet中就只存在插入的第一个元素。

如果将compareTo()返回值写死为1，元素值每次比较，都认为新插入的元素比上一个元素大，于是二叉树存储时，会存在根的右侧，读取时就是正序排列的。

如果将compareTo()返回值写死为-1，元素值每次比较，都认为新插入的元素比上一个元素小，于是二叉树存储时，会存在根的左侧，读取时就是倒序序排列的。

Map接口

值得注意的是Map没有继承Collection接口，Map接口是提供key到value的映射。一个Map中不能包含相同的key，每个key只能映射一个value。即是一一映射，Map接口提供3种集合的视图，Map的内容可以被当作一组key集合，一组value集合，或者一组key-value映射。

Map接口的实现类主要是包括HashMap和TreeMap等。

HaspMap

添加数据使用put(key, value)，取出数据使用get(key)， HashMap是允许null，即null value和null key。但是将HashMap视为Collection时（values()方法可返回Collection），其迭代子操作时间开销和HashMap的容量成比例。因此，如果迭代操作的性能相当重要的话，不要将HashMap的初始化容量设得过高，或者load factor过低。

举例：

import java.util.*;

public class TestD{

public static void main(String[] args)

{

Map M=new HashMap ();

M.put("one",new String("1"));

M.put("two",new String("2"));

System.out.println(M);

}

结果：

ConcurrentHashMap

并发下使用的线程安全的 HashMap 的替代品，基于JDK1.7源码。

数据存储结构，HashMap为Entry。

static final class HashEntry<K,V> {

final int hash;

final K key;

volatile V value;

volatile HashEntry<K,V> next;

}

// ConcurrentHashMap 采用了分段锁（Segment）技术，每个分段锁维护着几个桶（HashEntry），多个线程可以同时访问不同分段锁上的桶，Segment[]代替了table[]。

final Segment<K,V>[] segments;

//Segment核心类继承自重入锁ReentrantLock。

static final class Segment<K,V> extends ReentrantLock implements Serializable {

// ConcurrentHashMap默认并发级别是16，因为有16个Segmen。

// 默认并发级别为16

static final int DEFAULT_CONCURRENCY_LEVEL = 16;

总结

Java容器实际上只有三种:Map , List, Set;但每种接口都有不同的实现版本.它们的区别可以归纳为由什么在背后支持它们.也就是说,你使用的接口是由什么样的数据结构实现的.

**List的选择:**比如:ArrayList和LinkedList都实现了List接口.因此无论选择哪一个,基本操作都一样.但ArrayList是由数组提供底层支持.而LinkedList是由双向链表实现的.所以,如果要经常向List里插入或删除数据,LinkedList会比较好.否则应该用速度更快的ArrayList。

Set的选择HashSet总是比TreeSet 性能要好.而后者存在的理由就是它可以维持元素的排序状态.所以,如果需要一个排好序的Set时,才应该用TreeSet。

Map选择:同上,尽量选择HashMap。

其实每一个牵扯到底层得面试题都都不是很难，但是也不能掉以轻心，如果平时没有注意这个地方得知识，那你在面试的时候一定会让你吃亏，这就是开发这一行得魅力，享受这一行得刺激把