最近在学习语音识别,由于传统的基于HMM-GMM架构的语音识别具有成熟的理论、工具链,且其一直以来神秘感让人十分好奇;所以我打算从传统框架入手学...
参考 "On Adjusting the Learning Rate in Frequency Domain Echo Cancellation...
参考 《A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech En...
本篇目的: 1)回顾一下 基2-快速傅立叶变换(radix2-FFT) 的理论推导; 2)以C++语言用最直白的方式实现 基2-快速傅立叶变换[...
作为学习过程,我们尽量少用 库函数。由于我们需要进行复数乘法、加法运算,下面先粗糙地定义一下复数运算: 我们考虑使用静态大小的 FFT 样本点数...
小注包括: 1)以个人视角,分析了作者提出的新框架的动机,做一些讨论; 2)给出了一些关键公式的简单证明或说明; 记号约定: 1)向量用小写粗体...
参考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
参考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
位置编码 很多网友在讨论transfromer的self-attention模块中位置编码缺失问题时,一般会优先抛出CNN和RNN是位置...