如何利用python处理原始音频数据-CFANZ编程社区

特别鸣谢以下更多python教程请到友情连接：菜鸟教程https://www.piaodoo.com

初中毕业读什么技校 http://cntkd.net

茂名一技http://www.enechn.com

ppt制作教程步骤 http://www.tpyjn.cn

兴化论坛http://www.yimoge.cn

电白论坛 http://www.fcdzs.com

永城信息港 http://www.1l4u.com

茂名一技有什么专业 http://www.jeob.cn

茂名市高级技工学校 http://www.szsyby.net

初中毕业读什么技校 http://www.ausq.cn

一、基础知识

PCM(pulse code modulation) ，即脉冲编码调制，是将模拟信号转为数字信号的一种编码系统。而模数转换主要分两步，首先对连续的模拟信号进行采样，然后把采样得到的数据转化为数值，即量化。

设x xx为输入信号，F ( x ) F(x)F(x)为量化后的信号，则F ( x ) F(x)F(x)既可以是线性的，也可以是非线性的。在audioop中，主要提供三种编码支持，分别是a-Law，μ-Law以及ADPCM。

在中国和欧洲主要实用的编码方式为A-Law，其表达式为：

其中A AA为压缩系数，在G.726标准中建议87.56。

ADPCM(Adaptive Differential PCM)，即自适应差分PCM。

由于模拟信号的连续性，一般来说相邻时间单位的信号往往具有较高的线性度，甚至彼此相差无几，从而可以被高效率的压缩。然而，也存在跳跃幅度较大的信号，如果完全以缓变为原则，那么必然会丢失这部分数据。为了均衡这种差异，就需要进行自适应量化。

audioop中支持的Intel/DVI ADPCM算法可以在网上找到，但是信息并不多而且都很老旧，貌似不太重要的样子，甚至知网都搜不到，所以这里就不详细解读了。

二、转换函数

audioop提供了ADPCM、A-Law和μ-Law和线性采样之间的转换函数

采样	ADPCM	A-Law	μ-Law
lin2lin	lin2adpcm	lin2alaw	lin2ulaw
	adpcm2lin	alaw2lin	ulaw2lin

其中，与A-Law和μ-Law有关的转换函数的输入参数为(fragment, width)，分别代表待处理片段和位宽；adpcm则会多一个state元组作为第三个参数，表示编码器状态。

lin2lin是将线性片段在1、2、3 和 4 字节格式之间转换的函数，其输入参数为(fragment, width, newwidth)。

下面新建一些数据来测试一下编码转换函数，

#下面代码来自于test_audioop.py
import audioop
import sys
import unittest

pack = lambda width, data :b’’.join(
? ? v.to_bytes(width, sys.byteorder, signed=True) for v in data)

packs = {w: (lambda *data, width=w: pack(width, data)) for w in (1, 2, 3, 4)}

unpack = lambda width, data: [int.from_bytes(
? ? data[i: i + width], sys.byteorder, signed=True)
? ? for i in range(0, len(data), width)]

datas = {
? ? 1: b’\x00\x12\x45\xbb\x7f\x80\xff’,
? ? 2: packs[2](0, 0x1234, 0x4567, -0x4567, 0x7fff, -0x8000, -1),
? ? 3: packs[3](0, 0x123456, 0x456789, -0x456789, 0x7fffff, -0x800000, -1),
? ? 4: packs[4](0, 0x12345678, 0x456789ab, -0x456789ab,
? ? ? ? ? ? ? ? 0x7fffffff, -0x80000000, -1),
}

则datas的值为：

则其转换函数测试如下：

三、片段特征函数

下表中函数的输入为(fragment, width)，分别代表待统计片段和位宽。

	返回值
avg	片段采样值的均值
avgpp	片段采样值的平均峰峰值
max	片段采样值的最大绝对值
maxpp	声音片段中的最大峰峰值
minmax	由片段采样值中最小和最大值组成的元组
rms	片段的均方根
cross	片段穿越零点的次数