Info
Event based transcription system for polyphonic piano music
Summary
写完笔记之后最后填,概述文章的内容,以后查阅笔记的时候先看这一段。
注:写文章summary切记需要通过自己的思考,用自己的语言描述。忌讳直接Ctrl + c原文。
Research Objective(s)
主要还是改进复调音频transcript的算法
Background / Problem Statement
研究的背景以及问题陈述:作者需要解决的问题是什么?
本文工作灵感来自于G. Poliner等于2007年发表的a discriminative model for polyphonic piano transcription,在G. Poliner的文章中提出了一种用支持向量机来做transcript的方法。
但本文作者认为这种方法存在缺陷,因为这种方法在逐帧采样时没有考虑起始点采样,会导致在定义起始点的位置时出现问题。此外,基于窗采样的分类,其准确度没有参考价值。
注:
- onset是指每个音的attack,不是一段音乐的开端
Method(s)
作者提出的算法
作者提出了一种新的复调音乐的transcript技术,或者认为是一种系统,该系统由
- 开始检测算法(可以高精度的检测起始音)
- 识别和起始音相对应的每个music event
- 音符偏移检测:note offset detection
这三个子模块实现,具体的过程是先用开始检测算法定位音乐开始的地方,再基于SVM和CQT进行特征提取,然后再对SVM的输出结果进行逐帧的检查,就完成了note offset detection。
没看懂的地方
- note offset detection的意义是什么?
Evaluation
作者如何评估自己的方法?实验的setup是什么样的?感兴趣实验数据和结果有哪些?有没有问题或者可以借鉴的地方?
和作者参考的文章使用相同的数据集,但是由于二者对“准确度”的定义不太一样,所以在本文中使用的是“以事件为基础的评估”(an event basis)。
Conclusion
作者给出了哪些结论?哪些是strong conclusions, 哪些又是weak的conclusions(即作者并没有通过实验提供evidence,只在discussion中提到;或实验的数据并没有给出充分的evidence)?
本文中所提出的算法得到了不错的效果,但缺点是耗时比较大
Notes(optional)
不在以上列表中,但需要特别记录的笔记。
References(optional)
列出相关性高的文献,以便之后可以继续track下去。