0
点赞
收藏
分享

微信扫一扫

对哈夫曼编码的理解

梯梯笔记 2022-04-13 阅读 48

哈夫曼编码,主要目的是根据使用频率来最大化节省字符(编码)的存储空间。

简易的理解就是,假如我有A,B,C,D,E五个字符,出现的频率(即权值)分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树,即取1,2构成新树,其结点为1+2=3,如图:

34a41e499f3e4506a0d84ddfe5574157.png

虚线为新生成的结点,第二步再把新生成的权值为3的结点放到剩下的集合中,所以集合变成{5,4,3,3},再根据第二步,取最小的两个权值构成新树,如图:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA56aP5pifR0c=,size_8,color_FFFFFF,t_70,g_se,x_16

 再依次建立哈夫曼树,如下图:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA56aP5pifR0c=,size_8,color_FFFFFF,t_70,g_se,x_16

其中各个权值替换对应的字符即为下图:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA56aP5pifR0c=,size_15,color_FFFFFF,t_70,g_se,x_16

 所以各字符对应的编码为:A->11,B->10,C->00,D->011,E->010

霍夫曼编码是一种无前缀编码。解码时不会混淆。其主要应用在数据压缩,加密解密等场合。

如果考虑到进一步节省存储空间,就应该将出现概率大(占比多)的字符用尽量少的0-1进行编码,也就是更靠近根(节点少),这也就是最优二叉树-哈夫曼树。

为什么?-----> 权值大的在上层,权值小的在下层。满足出现频率高的码长短。

哈夫曼编码的带权路径权值:叶子节点的值 * 叶子节点的高度(根节点为0)

上图的带权路径长度为:(3+4+5)*2+(1+2)*3=33

 

 

 

以上转载自https://blog.csdn.net/qq_36653505/article/details/81701181

 

 

举报

相关推荐

0 条评论