0
点赞
收藏
分享

微信扫一扫

数据结构的底层原理及优缺点

小贴贴纸happy 2022-03-23 阅读 104
c#

目录

​ 

线性表

数组(Array)

ArrayList

List泛型集合

链表LinkedList

队列Queue

散列表(Hash表)

字典Dictionary,t>

非线性表

​树


在这里插入图片描述 

线性表

零个或多个数据元素的有限序列。每个线性表上的数据最多只有前和后两个方向。其实除了数组,链表、队列、栈等也是线性表结构。

数组(Array)

是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据

连续的内存空间和相同类型的数据:这两个限制也让数组的很多操作变得非常低效,比如要想在数组中删除、插入一个数据,为了保证连续性,就需要做大量的数据搬移工作。但是数组的随机访问效率确实十分的高。

数组支持随机访问,根据下标随机访问的时间复杂度为 O(1)。
数组的插入和删除都十分的低效。

优点:
1、按照索引查询元素速度快
2、按照索引遍历数组方便

缺点:
1、数组的大小固定后就无法扩容了
2、数组只能存储一种类型的数据
3、添加,删除的操作慢(要移动其他的元素)

适用场景:
频繁查询,对存储空间要求不大,很少增加和删除的情况。

ArrayList

优点:

  1. 不必在声明ArrayList时指定它的长度,因为ArrayList的长度是按存储的数据增长与缩减的。
  2. ArrayList可以存储不同类型的元素。因为ArrayList会把它的元素都当做Object来处理。

缺点:

  1. ArrayList类型不安全。因为当做Object来做处理,会在使用ArrayList时类型不匹配。
  2. 插入取出拆装箱

装箱 :将值类型转换成 object 再将包装后的对象存储在堆上。拆箱:将引用类型转换为值类型

装箱是隐式的;拆箱是显式的。 

List<T>泛型集合

长度灵活的改变,和ArrayList相比不同在于在声明List集合时,声明List集合类型,和Array很相似,List<T>内部使用了Array来实现。

好处:

  1. 确保类型安全。
  2. 取消装拆箱。
  3. 融合了Array可以快速访问的优点和ArrayList长度可以灵活变化的优点。

链表LinkedList<T>

链表是物理存储单元上非连续的、非顺序的存储结构,数据元素的逻辑顺序是通过链表的指针地址实现,每个元素包含两个结点,一个是存储元素的数据域 (内存空间),另一个是指向下一个结点地址的指针域。根据指针的指向,链表能形成不同的结构,例如单链表,双向链表,循环链表等。

在这里插入图片描述
链表的优点:
不需要初始化容量,可以任意加减元素;
添加,删除快(添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址)

缺点:
占用空间较大(因为含有大量的指针域
查找耗时(查找元素需要遍历链表来查找

适用场景:
数据量较小,需要频繁增加,删除操作的场景

队列Queue

队列与栈一样,也是一种线性表,不同的是,队列可以在一端添加元素,在另一端取出元素,也就是:先进先出。从一端放入元素的操作称为入队,取出元素为出队
使用场景:因为队列先进先出的特点,在多线程阻塞队列管理中非常适用。

注意:

  1. 默认情况下,Queue<T>的初始容量为32, 增长因子为2.0。
  2. 当使用Enqueue时,会判断队列的长度是否足够,若不足,则依据增长因子来增加容量,例如当为初始的2.0时,则队列容量增长2倍。

散列表(Hash表)

关于哈希,简单的说就是一种将任意长度的消息压缩到某一固定长度,

根据关键码和值 (key和value) 直接进行访问的数据结构,通过key和value来映射到集合中的一个位置,可以很快找到集合中的对应元素。

散列表就是把Key通过一个固定的算法函数(哈希函数)转换成一个整型数字,然后就将这个数字对数组长度进行取余,取余结果就是数组的下标,将value存储在下标为这个数字的数组里,可以利用数组的查找优势来查找元素,所以查找的速度很快。

哈希表,Java中有些集合类就是借鉴了哈希原理构造的,比如HashMap,HashTable等,利用hash表的优势,对于集合的查找元素时非常方便的,但是,因为哈希表是基于数组结构,在添加删除元素方面是比较慢的,所以很多时候用到一种数组链表来做,也就是拉链法。拉链法是数组结合链表的一种结构,较早前的hashMap底层的存储就是采用这种结构,直到jdk1.8之后才换成了数组加红黑树的结构
左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头,我们根据元素的一些特征把元素分配到不同的链表中去,也是根据这些特征,找到正确的链表,再从链表中找出这个元素。

哈希表的应用场景很多,当然也有很多问题要考虑,比如哈希冲突的问题,如果处理的不好会浪费大量的时间,导致应用崩溃。

栈是一种特殊的线性表,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。 栈的特点是:先进后出,或者说是后进先出,从栈顶放入元素的操作叫入栈,取出元素叫出栈。

在这里插入图片描述
越先放进去的东西越晚才能拿出来,所以,栈常应用于实现递归功能的场景,例斐波那契数列。

注意:

  1. 后进先出的情景。
  2. 默认容量为10。

字典Dictionary<K,T>

就是哈希表的实现方式,只不过字典是类型安全的

与哈希表的区别:

1.创建字典时,必须声明key和item的类型

2.是通过创建额外的2个数组来实现间接的索引,即int[] buckets和Entry[] entries两个数组(即buckets中保存的其实是entries数组的下标)

3.处理哈希冲突的策略:字典采用额外的数据结构来处理哈希冲突,数组buckets,buckets的长度就是字典的真实长度,因为buckets是字典每个位置的映射,buckets中的每个元素都是一个链表,用来存储相同哈希的元素,再分配存储空间。

缺点:以空间换时间,通过更多的内存开销满足追求。在创建字典时,我们可以传入一个容量值,但实际使用的容量并非该值。而是使用“不小于该值的最小质数来作为它使用的实际容量,最小是3。

新建字典,创建了2个长度为3的数组。

非线性表

比如二叉树、堆、图等。之所以叫非线性,是因为,在非线性表中,数据之间并不是简单的前后关系。

在这里插入图片描述

树是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:

1.每个节点有零个或多个子节点;
2.没有父节点的节点称为根节点;
3.每一个非根节点有且只有一个父节点;
4.除了根节点外,每个子节点可以分为多个不相交的子树;

二叉树

二叉树是树中的特殊的一种,具有如下特点:

1、每个结点最多有两颗子树,结点的度最大为2。
2、左子树和右子树是有顺序的,次序不能颠倒。
3、即使某结点只有一个子树,也要区分左右子树。
二叉树是一种比较有用的折中方案,它添加,删除,查找元素都很快,并且在查找方面也有很多的算法优化,所以,二叉树既有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用。

红黑树

B-Tree
B+Tree
扩展:
二叉树有很多扩展的数据结构,包括平衡二叉树、红黑树、B+树等,这些数据结构在二叉树的基础上衍生了很多的功能,在实际应用中广泛用到,例如mysql的数据库索引结构用的就是B+树,还有HashMap的底层源码中用到了红黑树。这些二叉树的功能强大,但算法上比较复杂,想学习的话还是需要花时间去深入的。

堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象,具有以下的性质:

1.堆中某个节点的值总是不大于或不小于其父节点的值;
2.堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2),满足前者的表达式的成为小顶堆,满足后者表达式的为大顶堆,这两者的结构图可以用完全二叉树排列出来,示例图如下:在这里插入图片描述

 

因为堆有序的特点,一般用来做数组中的排序,称为堆排序。

图是由结点的有穷集合V和边的集合E组成。其中,为了和树形结构区别,在图结构中把结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关系。

按照顶点指向的方向可分为无向图和有向图:

在这里插入图片描述在这里插入图片描述

图是一种比较复杂的数据结构,在存储数据上有着比较复杂和高效的算法,分别有邻接矩阵 、邻接表、十字链表、邻接多重表、边集数组等存储结构

举报

相关推荐

0 条评论