语音特征参数MFCC理解

1.先通俗理解：

参考知乎作者：我的上铺叫路遥
与其关注特征向量或特征值的实际含义，不如关注为何这样的特征向量或特征值是有效的。

举个例子，我本科时的学号是15020140011，可以作为我在大学的一个特征值。但是这个学号有什么具体含义吗？如果我没记错的话，15表示入学年份是2015年，14表示我在本系（1专业）第4个小班，后面的11代表班里的编号。但是这个学号是十分有效的，它是我在大学里唯一的标识，机器只要通过这个学号可以识别我，识别率100%。

MFCC同样的道理，它的13个系数（也许还有13个一阶差分和13个二阶差分）都是通过离散余弦变换（DCT）而来，并取前13个系数。

DCT的作用，为了获得频谱的倒谱，倒谱的低频分量就是频谱的包络，倒谱的高频分量就是频谱的细节，这些都是语音识别上经过科学验证十分有效的语音物理信息。但语音识别是对机器来说的，所以我们必须对物理信息进行某种“编码”，得到的就是MFCC13维特征向量，你是否理解它不重要，只要机器能够识别就行了。

综上所述，我认为MFCC的物理含义就是——在语音识别领域，将语音物理信息（频谱包络和细节）进行编码运算得到的一组特征向量。

2.MFCC再认识

用从最初的几个倒谱系数（虚线）获得的频率包络覆盖一段浊音（实线）的频率图

MFCC的物理含义，简单地说可以理解为语言信号的能量在不同频率范围的分布。如果把计算出的系数的低位部分（一般是前12个）作反傅立叶变换（IFFT），就可以得到上图中虚线表示的信号的频谱包络，也就是表示声带特征的那一部分低频信息。

要理解为什么可以这么做，我们先看看倒谱的定义：一种信号的傅里叶变换谱经对数运算后再进行的傅里叶反变换（IFFT）。（IFFT其实就是对频谱再作一次FFT）

人的发声过程可以看作是肺里的气流通过声带这个线性系统。如果用e(t)表示声音的输入激励（音高），h(t)表示声带的响应（也即我们需要获取的特征），那么听到的语音信号为

即两者的卷积。在频域内则可以表示为两者的乘积

通常在频域分析中我们只关注频谱的能量，忽略其相位信息，即

接下来对频谱作对数运算

最后再作傅里叶反变换便可以得到倒谱系数：

下面两幅图很好地解释了这个过程，语音信号的频谱可以看作是低频的包络和高频的细节相加，在得到倒谱系数后，我们只需要取低位的系数便可以得到包络信息。（这里的x[k]即为倒谱系数）

注意整个过程中我们并没有明确计算 e(t) 和 h(t) ，而是通过直接对语音信号x(t)作倒谱分析，再提取低位的倒谱系数，就可以获取我们想要的声道特征。

有意思的是，对数频谱作傅里叶反变换后的域被称为quefrency domain（对应频域frequency domain），quefrency domain和时域time domain类似但不完全一样。提取低位系数的操作称为low-time liftering（对应滤波操作filtering）。同样地，我们可以通过high-time liftering来获取激励特征。

image

当然在MFCC的实际计算中我们并没有作傅里叶反变换，而是先将频谱通过一组三角滤波器，再作离散余弦变换（DCT）得到MFCC系数。但其物理意义是一样的，即表示信号频谱的能量在不同频率区间的分布。每一个滤波器的作用就是得到对应频率区间的频谱能量，如果我们有26个三角滤波器，就会得到26个MFCC系数，这时候再取低位的系数就可以代表声道的特征。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,053评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,527评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,779评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,685评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,699评论 5赞 366
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,609评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,989评论 3赞 396
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,654评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,890评论 1赞 298
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,634评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,716评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,394评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,976评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,950评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,191评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,849评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,458评论 2赞 342

语音特征参数MFCC理解

1.先通俗理解：

2.MFCC再认识

推荐阅读更多精彩内容