Compact Disc
日常生活中大家都接触过CD,记得在2000年前后,当时MP3还未普及,IC当时听音乐、歌曲主要靠购买CD。CD一般来说是Compact Disc Digital Audio的简称,翻译成中文大概是紧凑型数字音频盘的意思。最初由飞利浦和索尼在上个世纪80年代初以红书(Red Book)的形式联合发布,在1987年被标准化组织IEC接纳为正式标准,编号为IEC 60908。这个标准最近一次修订是在1999年。飞利浦和索尼出版了一系列以颜色命名的标准,全部都是关于Compact Disc的,红书(Red Book)就是其中描述数字音频CD的一本。
IEC 60908整个标准还是挺繁杂的,我们只关注其中的编码部分。简单来说,存放于CD中的音频编码标准就是声音通道数为2、采样精度16位、编码格式为线性PCM、采样率固定是44.1KHz。
PCM Adaptor
在红书(Red Book)发布之前的1970年代,还存在着一种录音设备叫做PCM适配器。故名思义,它把模拟的音频信号转换成数字的PCM编码,并提供录制到视频存储设备上的接口。为什么音频和视频搅和在一起?因为当时已有的音频存储设备带宽不够大,不足以提供16位的PCM数字音频的存取带宽,这个带宽大概在1M~1.5M bit/s,这在当时是一个相当“高”的带宽,只有视频存储设备才有如此高的存取能力。PCM适配器把音频数据按特定的视频格式打包,从而可以借助于已有的“高带宽”视频存储设备实现音频数据的存取。
好吧,回忆一下我们之前在创刊号的问题:为什么CD的采样率是44.1KHz?到这里,已经非常的接近问题的答案了。那就是任何新事物都要尊重传统的力量。放到这里,那就是音频CD的采样率沿用了PCM适配器的采样率,而PCM适配器的采样率还要能够兼容视频存储设备的特定要求,以便利用现有的视频存取设备来存取其中的音频数据。
Video Format
当时大量存在的视频存储设备主要支持两种视频制式,一种是25帧制式(称为CCIR 625/50,也叫PAL),一种是30帧制式(称为EIAN 525/60,也叫NTSC)。当时世界上有电视普及的国家按这两种制式分为两个阵营。首先看30帧(即60场)制式,这种制式的一帧中,可利用来录制音频的视频行最多能有490行,分到每一场(Field)就有245行。在每一视频行可以平均存储3个音频采样点,那么音频出现的频率就是60*245*3 = 44100。这就是44.1KHz采样率的由来的原因之一。
同样在25帧(即50场)制式中,最大可利用的行数是588行,分到每一场有294行,同样每一行存放3个音频采样点,那么音频采样率就是50*294*3 = 44100 。这样的音频采样率可以保证对两种视频制式的最大限度兼容。
Prime Numbers
还有一种解释说明采用44100Hz的原因是,44100可以分解成2、3、5、7四个最小连续素数的平方的乘积。听起来有些神秘主义的倾向,IC推测这些素数因子有助于系统实现时的频率合成。
Symphony No. 9 (Beethoven)
还有一种更为传奇的说法,就是最初的CD设计团队发现,如果用48KHz的采样率的话,一张CD放不下74分钟版的贝多芬第九交响曲。而采用稍小的44.1KHz,则刚好可以放下。IC感觉这种说法有点儿太传奇太浪漫了,信不信由您。
好了,看到这里,想必您对CD为何采用44.1KHz的音频采样率已经有了一些了解。可以看出,任何一项新技术的发明和发展,都离不开对已有技术的依赖、消化和继承。任何创新都不是凭空从头脑中诞生的,而是一步一步脚踏实地的走出来的。这是IC在这个问题的探索中获得的最大感悟,与诸君分享。
敬请持续关注【IC.TECH】