0
点赞
收藏
分享

微信扫一扫

很简单却能让你面试头疼得 Java 容器,这里从源码给你解释清楚

陆佃 2021-09-28 阅读 36
日记本

之前在整理Redis的五大数据结构的时候,其中提到了list、set等知识点的时候,就想起来刚上大学那会的青涩时光,抱着一本Java生啃得时候得傻样,跟女朋友交流的时候,她说那你怎么不也顺便整理一下啊,自己也回想以下那个时候咱俩谈恋爱你让我在机房等你的时候,哼!(ps:我闲的没啥事提这茬干啥啊,先去哄一下再回来继续写啊

。。。

哄好了,回来继续写,翻出来那个时候整理的笔记,这是我做的思维导图(当时我的导师要求我做的,我感谢他培养了我这个习惯),正好在这里当作目录使用了(后面讲解得时候,我会展开展示)

个人公众号:Java架构师联盟,每日更新技术好文

在学Java以前,一说到存放东西,第一个想到的就是使用数组,使用数组,在数据的存取方面的却也挺方便,其存储效率高访问快,但是它也受到了一些限制,比如说数组的长度以及数组的类型,当我需要一组string类型数据的同时还需要Integer类型的话,就需要定义两次,同时,数组长度也受到限制,即使是动态定义数组长度,但是长度依然需要固定在某一个范围内,不方便也不灵活。

如果说我想要消除上面的这个限制和不方便应该怎么办呢?Java是否提供了相应的解决方法。答案是肯定的,这就是Java容器,java容器是javaAPI所提供的一系列类的实例,用于在程序中存放对象,主要位于Java.util包中,其长度不受限制,类型不受限制,你在存放String类的时候依然能够存放Integer类,两者不会冲突。

容器API类图结果如下所示:

Collection接口

Collection是最基本的集合接口,一个Collection代表一组Object,即Collection的元素。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接继承自Collection的类,Java SDK提供的类都是继承自Collection的“子接口”如List和Set。

举例:

import java.util.*;

public class TestA{

    public static void main(String[] args)

    {

        Collection lstcoll=new ArrayList();

  lstcoll.add("China");

  lstcoll.add(new String("ZD"));


      System.out.println("size="+lstcoll.size());

   System.out.println(lstcoll);

    }

结果:

List接口

List是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在List中的位置,类似于数组下标)来访问List中的元素,也就是说它是有顺序的,类似于Java的数组。和Set不同,List允许有相同的元素。J2SDK所提供的List容器类有ArrayList、LinkedList等。

实例:

import java.util.*;

public class TestB{

    public static void main(String[] args)

    {

        List l1=new LinkedList();

        for(int i=0;i<=5;i++){

            l1.add("a"+i);

        }

        System.out.println(l1);

        l1.add(3,"a100");

        System.out.println(l1);

        l1.set(6,"a200");

        System.out.println(l1);

        System.out.println((String)l1.get(2)+" ");

        l1.remove(1);

        System.out.println(l1);

    }

}

运行结果:

ArrayList

ArrayList其实就相当于顺式存储,它包装了一个数组 Object[],当实例化一个ArrayList时,一个数组也被实例化,当向ArrayList中添加对象时,数组的大小也相应的改变。这样就带来以下有特点: 快速随即访问,你可以随即访问每个元素而不用考虑性能问题,通过调用get(i)方法来访问下标为i的数组元素。 向其中添加对象速度慢,当你创建数组时并不能确定其容量,所以当改变这个数组时就必须在内存中做很多事情。 操作其中对象的速度慢,当你要向数组中任意两个元素中间添加对象时,数组需要移动所有后面的对象。

下面我们来看一下源码级实际操作

基于数组,支持快速随机访问

public class ArrayList<E> extends AbstractList<E>

       implements List<E>, RandomAccess, Cloneable, java.io.Serializable // 实现了RandomAccess表示支持快速随机访问

数组默认大小为10,基于数组实现

private static final int DEFAULT_CAPACITY = 10;

transient Object[] elementData; // non-private to simplify nested class access

添加元素时会调用add()方法,同时使用ensureCapacityInternal()方法来保证调用add()方法时数组的容量,当数组容量不够时,会调用grow()方法进行扩容。

扩容代码:

private void grow(int minCapacity) {

       // overflow-conscious code

       int oldCapacity = elementData.length;

       int newCapacity = oldCapacity + (oldCapacity >> 1); // 扩容大小为原来的1.5倍

       ......

      ......

// minCapacity is usually close to size, so this is a win:

       elementData = Arrays.copyOf(elementData, newCapacity); // 将原来的数组拷贝进新的数组,扩容的代价高

   }

删除元素是会调用system.arraycopy()方法,将index+1后面的元素都复制到index的位置上,代价高

System.arraycopy(elementData, index+1, elementData, index, numMoved);

LinkedList

LinkedList相当于链式存储,它是通过节点直接彼此连接来实现的。每一个节点都包含前一个节点的引用,后一个节点的引用和节点存储的值。当一个新节点插入时,只需要修改其中保持先后关系的节点的引用即可,当删除记录时也一样。这样就带来以下特点: 操作其中对象的速度快,只需要改变连接,新的节点可以在内存中的任何地方。 不能随即访问,虽然存在get()方法,但是这个方法是通过遍历接点来定位的,所以速度慢。

代码实现

private static class Node<E> {

       E item;

       Node<E> next;

       Node<E> prev;

       Node(Node<E> prev, E element, Node<E> next) {

           this.item = element;

           this.next = next;

           this.prev = prev;

       }

   }

Set接口

Set是一种不包含重复的元素的Collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,Set最多有一个null元素。 Set的构造函数有一个约束条件,传入的Collection参数不能包含重复的元素。

Set容器类主要有HashSet和TreeSet等。

HashSet

此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。它不保证 set 的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。

举例:

import java.util.*;

public class TestC{

    public static void main(String[] args)

    {

        Set s=new HashSet();

        s.add("Hello");


   //相同元素

        s.add("Hello");

        System.out.println(s);

    }

结果:

treeset

TreeSet是一个有序的集合,它的作用是提供有序的Set集合。它继承了AbstractSet抽象类,实现了NavigableSet<E>,Cloneable,Serializable接口。TreeSet是基于TreeMap实现的,TreeSet的元素支持2种排序方式:自然排序或者根据提供的Comparator进行排序。

实例

public static void demoOne() {

       TreeSet<Person> ts = new TreeSet<>();

       ts.add(new Person("张三", 11));

       ts.add(new Person("李四", 12));

       ts.add(new Person("王五", 15));

       ts.add(new Person("赵六", 21));


       System.out.println(ts);

   }

执行结果:会抛出一个 异常:java.lang.ClassCastException显然是出现了类型转换异常。原因在于我们需要告诉TreeSet如何来进行比较元素,如果不指定,就会抛出这个异常

如何解决:如何指定比较的规则,需要在自定义类(Person)中实现Comparable接口,并重写接口中的compareTo方法

public class Person implements Comparable<Person> {

   private String name;

   private int age;

   ...

   public int compareTo(Person o) {

       return 0;                //当compareTo方法返回0的时候集合中只有一个元素

       return 1;                //当compareTo方法返回正数的时候集合会怎么存就怎么取

       return -1;                //当compareTo方法返回负数的时候集合会倒序存储

   }

}

为什么返回0,只会存一个元素,返回-1会倒序存储,返回1会怎么存就怎么取呢?原因在于TreeSet底层其实是一个二叉树机构,且每插入一个新元素(第一个除外)都会调用compareTo()方法去和上一个插入的元素作比较,并按二叉树的结构进行排列。

如果将compareTo()返回值写死为0,元素值每次比较,都认为是相同的元素,这时就不再向TreeSet中插入除第一个外的新元素。所以TreeSet中就只存在插入的第一个元素。

如果将compareTo()返回值写死为1,元素值每次比较,都认为新插入的元素比上一个元素大,于是二叉树存储时,会存在根的右侧,读取时就是正序排列的。

如果将compareTo()返回值写死为-1,元素值每次比较,都认为新插入的元素比上一个元素小,于是二叉树存储时,会存在根的左侧,读取时就是倒序序排列的。

Map接口

值得注意的是Map没有继承Collection接口,Map接口是提供key到value的映射。一个Map中不能包含相同的key,每个key只能映射一个value。即是一一映射,Map接口提供3种集合的视图,Map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。

Map接口的实现类主要是包括HashMap和TreeMap等。

HaspMap

添加数据使用put(key, value),取出数据使用get(key), HashMap是允许null,即null value和null key。但是将HashMap视为Collection时(values()方法可返回Collection),其迭代子操作时间开销和HashMap的容量成比例。因此,如果迭代操作的性能相当重要的话,不要将HashMap的初始化容量设得过高,或者load factor过低。

举例:

import java.util.*;

public class TestD{

    public static void main(String[] args)

    {

        Map M=new HashMap ();

        M.put("one",new String("1"));

        M.put("two",new String("2"));

        System.out.println(M);

    }

}

结果:

ConcurrentHashMap

并发下使用的线程安全的 HashMap 的替代品,基于JDK1.7源码。

数据存储结构,HashMap为Entry。

static final class HashEntry<K,V> {

   final int hash;

   final K key;

   volatile V value;

   volatile HashEntry<K,V> next;

}

  // ConcurrentHashMap 采用了分段锁(Segment)技术,每个分段锁维护着几个桶(HashEntry),多个线程可以同时访问不同分段锁上的桶,Segment[]代替了table[]。

final Segment<K,V>[] segments;

//Segment核心类继承自重入锁ReentrantLock。

static final class Segment<K,V> extends ReentrantLock implements Serializable {


// ConcurrentHashMap默认并发级别是16,因为有16个Segmen。

  // 默认并发级别为16

static final int DEFAULT_CONCURRENCY_LEVEL = 16;

总结

Java容器实际上只有三种:Map , List, Set;但每种接口都有不同的实现版本.它们的区别可以归纳为由什么在背后支持它们.也就是说,你使用的接口是由什么样的数据结构实现的.

**List的选择:**比如:ArrayList和LinkedList都实现了List接口.因此无论选择哪一个,基本操作都一样.但ArrayList是由数组提供底层支持.而LinkedList是由双向链表实现的.所以,如果要经常向List里插入或删除数据,LinkedList会比较好.否则应该用速度更快的ArrayList。

Set的选择HashSet总是比TreeSet 性能要好.而后者存在的理由就是它可以维持元素的排序状态.所以,如果需要一个排好序的Set时,才应该用TreeSet。

Map选择:同上,尽量选择HashMap。

其实每一个牵扯到底层得面试题都都不是很难,但是也不能掉以轻心,如果平时没有注意这个地方得知识,那你在面试的时候一定会让你吃亏,这就是开发这一行得魅力,享受这一行得刺激把

举报

相关推荐

0 条评论