一、医学图像处理的意义
医学图像是反映人体内部结构的图像,是现代医疗诊断的主要依据之一。目前,医学图像处理任务主要集中在图像检测、图像分割、图像配准及图像融合四个方面。
医学图像数据具有可获得、质量高、体量大、标准统一等特点,使人工智能在其中的应用较为成熟。利用图像处理技术对图像进行分析和处理,实现对人体器官、软组织和病变体的位置检测、分割提取、三维重建和三维显示,可以对感兴趣区域(Region of Interest, ROI)进行定性甚至定量的分析,从而大大提高临床诊断的效率、准确性和可靠性,在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用。
二、医学图像处理的主要任务
2.1 图像检测
图像检测是计算机辅助检测的基础,并且非常适合引入深度学习。医学图像检测的传统方法是通过监督方法或传统数字图像处理技术检测候选病变位置。基于深度学习的方式是基于影像学数据或理论指导,训练网络,发现病变,提高诊断准确率。
2.2 图像分割
目前医学图像分割处理的对象主要是各种细胞、组织、器官的图像,医学图像分割的过程是:根据区域间的相似或不同,把图像分割成若干区域。
传统的图像分割技术有基于区域的分割方法和基于边界的分割方法,前者依赖于图像的空间局部特征,如灰度、纹理及其它像素统计特性的均匀性等,后者主要是利用梯度信息确定目标的边界。
结合特定的理论工具,图像分割技术有了更进一步的发展。比如基于三维可视化系统结合FastMarching算法和Watershed 变换的医学图像分割方法,能得到快速、准确的分割结果[1]。
随着其它新兴学科的发展,产生了一些全新的图像分割技术。如基于统计学的方法、基于模糊理论的方法、基于神经网络的方法、基于小波分析的方法、组合优化模型等方法。
虽然不断有新的分割方法被提出,但结果都不是很完美。目前医学图像分割方法的研究具有如下显著特点:现有任何一种单独的图像分割算法都难以对一般图像取得比较满意的结果,要更加注重多种分割算法的有效结合。在目前无法完全由计算机来完成图像分割任务的情况下,人机交互式分割方法逐渐成为研究重点,除此之外,分割方法的研究重点主要是:自动、精确、快速、自适应、鲁棒性、多模态融合等方向。
2.3 图像配准
图像配准是图像融合的前提,是公认难度较大的图像处理技术,也是决定医学图像融合技术发展的关键技术。
在临床诊断中,单一模态的单张图像往往不能提供医生所需要的足够信息,因此,医生经常需要将多种模式或同一模式的多次成像配准融合,从而实现感兴趣区域的信息互补。根据患者多方面的综合信息,医生才能做出更加准确的诊断或制定出更加合适患者的治疗方法[2]。
图像配准就是要对几幅图像作定量分析,首先需要解决图像之间的严格对齐问题。医学图像配准包括图像的定位和转换,即通过寻找一种空间变换使两幅图像对应点达到空间位置和解剖结构上的完全一致。配准的结果应该至少使有诊断意义的点,及手术感兴趣的点达到匹配。
2.4 图像融合
图像融合的主要目的是通过对多幅图像间的冗余数据的处理来提高图像的可读性,对多幅图像间的互补信息的处理来提高图像的清晰度。多模态医学图像的融合把有价值的生理功能信息与精确的解剖结构结合在一起,可以为临床提供更加全面和准确的资料[3]。
图像数据融合主要有以像素为基础的方法和以图像特征为基础的方法。前者是对图像进行逐点处理,把两幅图像对应像素点的灰度值进行加权求和、灰度取大或者灰度取小等操作,算法实现比较简单,不过实现效果和效率都相对较差,融合后图像会出现一定程度的模糊。后者要对图像进行特征提取等处理,用到的算法原理复杂,实现效果比较理想。
三、医学图像数据的介绍
3.1 数据的获取
医学图像的目的是使观察者看到患者体内的物体或状况,因此医学图像必须呈现特定解剖特征的,这取决于成像系统的特性及其操作方式,大多数医学成像系统具有相当多的操作变量,它们可以是可变系统组件,例如:磁共振成像(MRI)中的线圈,或者是与成像过程相关的可调节物理量,例如:MRI中的回声时间(TE)。选择的值将决定图像的质量和看到的特定解剖特征。
医学图像通常都是患者的真实数据资料,如果需要获取,大家可以寻找公开数据库的资料。现在很多机构也举行了医学图像处理任务比赛,医学影像的研究资料在网络上已经很常见。
3.2 图像数据的类型
医学图像处理的对象是各种不同成像机理的医学影像,临床广泛使用的医学成像种类主要有:X-射线成像 (X-CT)、电脑断层扫描(CT)、正电子发射计算机断层显像(PET-CT)、核磁共振成像(MRI)、核医学成像(NMI)、超声波成像(UI)、显微镜下拍摄的病理图像等。
3.3 数据格式的标准
DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准。这也是目前应用最为广泛的医学影像格式,常见的CT,核磁共振,心血管成像等大多采用Dicom格式的存储。
doicm主要存储两方面信息:关于患者的PHI(Protected Health Imformation)信息和图像信息。PHI就是患者的相关信息。例如:姓名,性别,年龄,继往病历等。图像信息包括两部分,一部分信息是扫描过后患者图像的某一层切片,医生通过专门的Dicom阅读器打开,察看患者病情。另一部分是相关的设备信息,例如生产的Dicom图像是X光机扫描出的X光图像的某一层,那么Dicom就会存储关于此X光机的相关设备信息。
四、医学图像处理任务的评价指标
4.1 交并比
交并比(Intersection over Unoin, IoU)是检测结果的矩形框与样本标注的矩形框的交集与并集面积的比值。一般对于检测框的判定都会存在一个阈值,常见的阈值为0.5,当计算得到的IoU大于0.5时可以认为检测到目标物体。
4.2 四种结果及其引申指标
实际任务中的分类任务常常作为检测任务后的一个小任务,但他的评价指标较多,因此单独在本节中列出
首先要说明,从成像过程得出的诊断将病例分为四类:实际是阳性并被预测正确,即为真阳性(True Positive, TP),实际是阴性并被预测正确,即为真阴性(True Negative, TN),实际是阳性并被预测错误,即为假阳性(False Positive, FP)和实际是阴性并被预测错误,即为假阴性(False Negative, FN),四种结果如下表所示,其中1代表阳性和正确,0代表阴性和错误。大部分医学图像处理任务评价指标,都可以用这四个结果计算得出。
在理想情况下,只有真阳性和真阴性病例。出于多种原因出现假阴性和假阳性,包括特定成像方法的固有限制,图像处理方式限制。
准确率(accuracy)是分类任务的常见评价指标,是分类正确的样本数除以所有样本数,即:
accuracy = (TP+TN)/(TP+TN+FP+FN)
召回率(recall)也叫做灵敏度(True Positive Rate),指在总的正样本中,找回了多少正样本,即:
recall = TP/(TP+FN)
F1分数(F1-score)认为召回率和精度同等重要, 一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。计算公式如下:
F1 = 2TP/(2TP+FP+FN)
受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC)横轴为FP,纵轴为TP,曲线描述的其实是分类器性能随着分类器阈值的变化而变化的过程。
理想的算法产生100%的灵敏度和100%的特异性,成像方法的特征和所得图像的质量决定了实际曲线的形状以及特定病理状况的灵敏度和特异性之间的关系,观察者用于进行诊断的标准确定曲线上产生实际灵敏度和特异性值的点。有关ROC曲线的更多理论细节,可以查看学习资料[4]。
4.3 其他
医学图像分割与配准指标较少,分割精度就是分割准确面积与标注的真实分割面积之比。配准的指标主要是配准图像的像素与标注图像像素的物理距离。
医学图像融合的指标主要有以下这些:空间频率,反映图像灰度变化,平均梯度,衡量图像的清晰程度,平均梯度越大,图像清晰度越好。互信息,度量融合图像与输入图像在灰度分布上的相似程度,即融合图像保留原图像信息的多少。如果还想了解更多指标,可以动手搜索相关文献了解。
五、医学图像处理领域的挑战
5.1 数据维度问题
在迄今为止的大多数工作中,是在2D图像中进行处理分析,目前有越来越多的人转向3D数据处理的研究,其中存在很多新的问题和挑战。
5.2 学习方法
当我们查看网络文献时,大多数工作都集中在受监督的CNN上,这种网络对于许多应用是重要的,包括检测,分割和标记。因此基于深度学习的方法仍然是目前最热门的方法,而其中的可解释性和新的网络结构方面,仍然存在非常大的挑战和可发展空间。另外,仍然有一些研究人员专注于无监督方案,有不少人期待着无监督方案有更好的表现。
5.3 迁移学习和微调
在医学成像领域经常遇到没有足够的数据的情况,此时可以尝试两种方法:迁移学习和网络微调。迁移学习是指从自然图像数据集或不同医学领域预训练的网络模型用于新的医疗任务。在一个方案中,预先训练CNN应用于输入图像,然后从网络层提取输出。提取的输出被认为是特征并且用于训练单独的模式分类器。网络微调是指当手头的任务确实存在中等大小的数据集时,使用预先训练的CNN作为网络的初始化,然后进行进一步的监督训练,其中几个(或全部)网络层,使用任务的新数据。
5.4 数据隐私
受社会和技术问题的影响,需要从社会学和技术学的角度共同解决。在医疗保健数据不断增加的同时,研究人员面临如何加密患者信息以防止其被使用或披露的问题。但是不合理的限制访问可能使临床决策缺少非常重要的信息。
六、CVPR2020医学图像处理类论文推荐
6.1 图像检测
- 半监督学习方法 + 3D医学图像检测
FocalMix: Semi-Supervised Learning for 3D Medical Image Detection
作者 | Dong Wang, Yuan Zhang, Kexin Zhang, Liwei Wang
单位 | 北京大学;医准智能
- 乳腺X线检测
Cross-View Correspondence Reasoning Based on Bipartite Graph Convolutional Network for Mammogram Mass Detection
作者 | Yuhang Liu, Fandong Zhang, Qianyi Zhang, Siwen Wang, Yizhou Wang, Yizhou Yu
单位 | Deepwise AI Lab;北大
6.2 图像分割
- 用于CT扫描中的管状结构分割
Deep Distance Transform for Tubular Structure Segmentation in CT Scans
作者 | Yan Wang, Xu Wei, Fengze Liu, Jieneng Chen, Yuyin Zhou, Wei Shen, Elliot K. Fishman, Alan L. Yuille
单位 | 约翰斯霍普金斯;加利福尼亚大学圣迭戈分校;同济大学等
- 用于3D医学图像分割
C2FNAS: Coarse-to-Fine Neural Architecture Search for 3D Medical Image Segmentation
作者 | Qihang Yu, Dong Yang, Holger Roth, Yutong Bai, Yixiao Zhang, Alan L. Yuille, Daguang Xu
单位 | 约翰斯霍普金斯;英伟达
6.3 图像配准
- 基于学习的医学图像配准的高效网络
DeepFLASH: An Efficient Network for Learning-Based Medical Image Registration
作者 | Jian Wang, Miaomiao Zhang
单位 | 弗吉尼亚大学
代码 |https://github.com/jw4hv/deepflash
2.Fast Symmetric Diffeomorphic Image Registration with Convolutional Neural Networks
作者 | Tony C.W. Mok, Albert C.S. Chung
单位 | 香港科技大学
七、参考资料
[1]. 林瑶, 田捷. 医学图像分割方法综述[J]. 模式识别与人工智能, 2002, 15(2).
[2]. 周永新, 罗述谦. 一种人机交互式快速脑图像配准系统[J] . 北京生物医学工程, 2002; 21 (1) :11~14
[3]. 林晓, 邱晓嘉. 图像分析技术在医学上的应用 [J] . 包头医学院学报, 2005, 21 (3) :311~ 314
[4]. 李开文. ROC曲线简介
[DB/OL]. (2017-04-11)[2021-08-05]. https://zhuanlan.zhihu.com/p/26293316.