音频数字化
- 采样:众所周知,声音是一种压力波,是连续的,然而在计算机中无法表示连续的数据,所以只能通过间隔采样的方式进行离散化,其中采集的频率称为采样率。
* mp3:44100hz
* 母带:48000hz
* 网络音视频:16000hz
* 电话:8000hz (人正常说话 300-1200hz)
根据奈奎斯特采样定理 ,当采样率大于信号最高频率的2倍时信号频率不会失真。人类能听到的声音频率范围是20hz到20khz,所以CD等采用了44.1khz采样率能满足大部分需要。
所以44.1khz可以表示频率范围是什么?(0-221500hz)
-
量化:每次采样的信号强度也会有精度的损失,如果用16位的Int(位深度)来表示,它的范围是[-32768,32767],因此位深度越高可表示的范围就越大,音频质量越好
- mp3:16bit(大概可以记录96分贝动态范围)
- 部分无损:32bit (大概可以记录144分贝的动态范围)
- 网络音视频通讯:8bit (大概可以记录48分贝的动态范围)
声道数: 一般来说声源个数即代表声道个数
为了更好的效果,声音一般采集左右双声道的信号,如何编排呢?一种是采用交错排列(Interleaved): LRLRLRLR ,另一种采用各自排列(non-Interleaved): LLL RRR。