音频基础知识


音频的量化过程

音频的量化就是将模拟信号采样后转换成一种数字信号的过程

模拟信号转换数字信号的基本流程图
模拟信号量化流程图.jpg
模拟波形的数字采样
量化编码
量化过程有如下概念:
  • 采样大小:就是我们采样模拟型号值表达的Y轴的高度(幅值),也就是一个采样需要多少个bit位来存储,常用的是8bit、16bit
  • 采样率:采样模拟型号的频率(每秒采集N次模拟信号样本),是单位Hz,也就是我们常熟的采样频率,通常采样频率越高,精度也越高,常用的采样频率有8K、16K、32K、44.1K、48K,对于AAC来说一般来说采用44.1K
  • 声道数:有单声道、双声道、多声道
  • 比特率:比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,每秒传送数据就越多,画质就越清晰。声音中的比特率(码率)是指将模拟声音信号转换成数字声音信号后,单位时间内的二进制数据量,是间接衡量音频质量的一个指标。 计算一个PCM(脉冲编码调制)音频流的码率公式如下:
    采样率 * 采样大小 * 声道数:例如一个PCM编码的音频文件,它的采样率为44.1KHz,采样大小为16bit,双声道,那么码率为44.1KHz * 16 * 2 = 1411.2Kb/s
常见音频压缩方法:

主要两种方法:

  • 消除冗余数据:我们成为有损压缩技术,我们在音频的采集过程中,但是其中只有一部分是人能够识别出来的,我们对人能够识别出来的数据进行筛选,这样叫减少了数据的存储
  • 哈夫曼无损压缩
常见音频编码器:

OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等

应用领域和优缺点:

  • OPUS编码器是一个有损声音编码的格式,格式是一个开放格式,没有任何专利或限制,低码率下Opus完胜曾经优势明显的HE AAC,中码率就已经可以媲敌码率高出30%左右的AAC格式,而高码率下更接近原始音频。
  • AAC用在泛娱乐化直播系统里用的比较多,RTMP支撑AAC,SPEEX,但是不支持OPUS
  • Speex早于OPUS和AAC,最大的特点是包括外围的模块,降噪,回音消除
  • G.711多用于电话系统

性能评测对比图:


音频编码器性能对比.jpg
AAC (Advanced Audio Coding) 高级音频编码:

出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC

  • AAC优缺点
    优点:相对于mp3,AAC格式的音质更佳,文件更小
    不足:AAC属于有损压缩的格式,与时下流行的APE、FLAC等无损格式相比音质存在“本质上”的差距

  • AAC 常用规格:AAC LC、AAC HE V1、AAC HE V2
    AAC LC:(Low Complexity)低复杂度,码流128K
    AAC HE V1:AAC LC + SBR (Spectral Band Replication)采用分频复用,将一个音频的频带分成低频和高频两部分分别进行编码,对于低频信号采样记录主体信号,从而减少采样数据。对于高频数据,同样采样率下高频采样的样本会相对于低频少很多,使用SBR技术则增加高频信号的采样数目,从而保证高频的音质,这样就实现了采样的码率的同时又提高了高频数据的音质
    AAC HE V2:AAC LC + SBR + PS (Parametric Stereo) 双声道分别保存,一个声道完整保存,另一个声道存储差异信息和相关参数信息

  • AAC常用格式:
    ADIF (Audio Data Interchange Format) 音频数据交换格式:这种格式的特征是可以确定的找到这个音频数据的开始,不需进行在音频数据流中间开始的解码,即它的解码必须在明确定义的开始处进行,故这种格式常用在磁盘文件中
    ADTS(Audio Data Transport Stream) 音频数据传输流:每一帧都有一个同步字,可以在音频的任何位置开始解码

  • AAC常用编码库
    libfdk_aac、ffmpeg aac、libfaac、libvo_aacenc性能也是由左向右递减

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容

  • 概述 本片文章主要介绍音频基础,在做音频开发之前首先必须要对音频的相关概念了解。以下是具体内容概述: 常见的音频格...
    iosmedia阅读 2,632评论 0 1
  • 一、声音的三要素 1.音调 人耳对声音高低的感觉称为音调(也叫音频)。音调主要与声波的频率有关。声波的频率高,则音...
    一叶知秋0830阅读 15,256评论 0 10
  • 前言: 记载资料多为网络搜集,侵删。 根据最近接触的整机项目做了一些整机音频相关基础知识的总结,如有不足或表述问题...
    Gawain_Knowknow阅读 8,106评论 0 4
  • Android 音频开发 目录 Android音频开发(1):音频相关知识 Android音频开发(2):使用Au...
    android_赵乐玮阅读 27,239评论 4 58
  • 不作死就不会死许多人的护肤行为有意无意的在损伤皮肤。皮肤不会说话,因此我要替她吼一句:不要太过刺激我,因为我也是有...
    54e4dd821241阅读 306评论 0 1