https://arxiv.org/pdf/2005.14355.pdf 作者:Nvidia
摘要:目标分割在现代医学图像分析中占有重要的地位,它有利于临床研究、疾病诊断和手术计划。鉴于医学图像的各种模式,自动或半自动分割方法已被用于识别和分析器官、骨骼、肿瘤和其他感兴趣区域(ROI)。然而,由于图像处理过程中的模糊对比度,这些现代的分割方法往往无法预测ROI的边界区域。为了进一步提高边界区域的分割质量,我们提出了一个边界增强损失。所提出的损失函数轻量、易实现且无需任何前处理或后处理。我们的实验结果验证了我们的损失函数在分割精度方面与其他最新损失函数相比要更好或者至少有可比性。
1.引言
过去十年,自动或半自动的分割方法已被广泛的发展用来识别和分析器官、骨骼、肿瘤和其他感兴趣区域(ROI)。然而,大多数分割方法往往难以在对比度模糊的医学图像的前景边界区域产生高质量的分割,模糊通常是由于图像采集过程中的扫描仪设置、呼吸或身体运动造成的。
最近,基于神经网络的方法被用于分割任务,并在不同图像模式的各种数据集中取得了最先进水平。这些模型采用U形的卷积编码-解码的方式,将图像作为输入,输出分割掩膜,使用基于梯度的优化进行端到端的训练,最小化损失函数,如多类加权交叉熵、Dice loss(2016)。尽管这些损失函数可以处理类别不平衡问题,但不能很好的解决边界区域分分割问题,因为这些函数对所有像素/体素的处理都是一样的。
为进一步提高分割性能,我们引入一个新的损失函数,称为边界增强损失,在训练过程中明确地关注边界区域。我们提出的方法与之前的试图改进深度网络的边界分割的工作具有相似的动机,例如(Chen et al., 2016; Oda et al., 2018; Karimi and Salcudean, 2019; Kervadec et al., 2018)。与之前的工作不同,我们的方法是轻量的,计算量小,不需要前处理和后处理,以及任何特殊的网络结构。此外,我们的方法对各种分割应用都有效,易于实现,可以插入到任何3D主干网络中。
2. 方法
为了加强边间区域,我们将拉普拉斯滤波器应用到公式中的3D二类分割掩膜中,拉普拉斯滤波器在边界区域周围产生强响应,在其他地方产生零响应。
离散的拉普拉斯滤波器可以通过标准的三维卷积运算来实现。因此,可以很容易地计算出真值的滤波输出和神经网络预测的掩膜的滤波输出。最小化两个滤波输出的差异可以隐式地缩小真值和预测掩膜之间的差距。因此,边界增强损失定义为公式中的L2范数形式,记为。同时,可以有效地抑制远离边界区域的假阳错误,并消除远离边界区域的异常值。
在实际应用中,边界增强损失被实现为一系列单通道3×3×3无偏置的卷积运算。前三个连续的卷积层的卷积核是相同的,是常数值1/27,用于平滑。最后一个卷积核具有标准三维离散拉普拉斯核的固定值。中所有卷积核参数都是不可训练的。整个运算与高斯-拉普拉斯(LoG)滤波的边缘检测相似。图1所示是有真值标签的拉普拉斯滤波的示例。
我们方法的整体损失是soft Dice loss和我们所提的边界增强(BE)损失的组合:
和是两个损失之间的加权系数。边界增强损失不能在没有soft Dice loss的情况下单独使用,因为它不能区分内部和外部。以标签值为常数(0或1)的区域为例,在图1所示的滤波之后,除边界之外的任何地方的滤波输出都将为零。
3. 实验与讨论
数据集 为了涵盖不同的物体和图像模式,采用医学十项全能挑战MSD的任务1(脑肿瘤MRI分割)和任务9(脾脏CT分割)的数据集进行实验,我们自己划分训练集和验证集。对于任务1,388个多通道MRI volumns作为训练集,96个作为验证集。对于任务9,32个CT volumns作为训练集,9个作为验证集。两个数据集都重新采样使各向同性分辨率1.0 mm。对于任务1,体素用均匀正态分布归一化。对于任务9,体素强度根据总体前景强度的第5和第95个百分位数被标准化为范围[0,1]。
实现 我们的baseline来自(Myronenko,2018),它具有使用3D残差块的卷积编码器-解码器结构。训练过程中,网络的输入分别为224×224×128 (task 1)和96×96×96 (task 9)大小的块,从图像中随机裁剪。所有实验的和分别为1和1000。都使用Adam优化器。使用必要的数据增强技术,包括随机翻转和随机强度偏移。此外,验证遵循相邻窗口之间重叠较小的扫描窗口方案。在扫描窗口推断后,用Dice的得分来衡量验证的准确性。最终结果见表1。我们的实验结果表明,我们提出的方法能够在结构物体(如器官)和非结构物体(如肿瘤)上有效地工作。同时,它也适用于不同的医学图像(CT、MRI等)。此外,我们提出的边界增强损失可以很容易地插入到任何三维分割主干网络中。
疑问:论文中公式中等式的中间部分和右边部分对应两种不同的操作,中间部分是真值和预测值先分别拉氏变换-相减-L2;右边部分是相减-拉氏变换-L2