European Radiology:深度学习时代的CT图像质量评估
2023-02-26 shaosai MedSci原创 发表于上海
鉴于迭代重建算法的广泛采用,放射科医生已经习惯了由这些迭代重建技术产生的图像纹理。
作为新一代的CT重建方法,深度学习图像重建(DLIR)是一项通过训练计算机算法并从数据中学习而开发的工具,这些数据是在高剂量水平下获得的CT图像,通过滤波后投影(FBP)重建,可以真实地表达扫描对象的信息。
目前关于DLIR评估的文献包括两种不同的主要研究类型。第一类主要需要对临床获得的病人图像进行主观的放射学评价,并对不同的重建算法进行比较。第二类研究涉及模型研究,重点是噪声功率谱和噪声纹理。一个关键的发现是,DLIR的噪声纹理比迭代重建更接近FBP,这一点从噪声功率谱的形状可以看出。然而,在评估DLIR的功能和保真度时,两种方法都有关键的局限性。第一种方法往往局限于一个单一的剂量水平/方案,而且通常只是定性的。第二种方法主要是定量的,但受限于简单化模型中的非现实结构,这不是用于DLIR算法训练的目标。
鉴于迭代重建算法的广泛采用,放射科医生已经习惯了由这些迭代重建技术产生的图像纹理。为了使临床社区从迭代重建算法过渡到较新的DLIR技术,有必要探索并提供指导,说明DLIR的不同强度水平在与迭代重建设置相比较时的表现如何。
近日,发表在European Radiology杂志的一项研究将DLIR和ASiR-V与现实的解剖图像进行了定量比较,对DLIR的功能和保真度提供了可靠的、可重复的和定量的评估。
研究使用三种常规方案(脑部、胸部和腹部)在四种剂量水平下获取拟人模型的CT扫描,并在五种ASiR-V水平和三种DLIR水平下重建图像。噪声功率谱(NPS)是通过减去重复扫描的两幅匹配图像,并用差值图像来估计。使用最大剂量的FBP重建作为基础,评估了差异图像的结构相似性指数(SSIM)和梯度幅度(GM)。使用图像噪声大小(σ)、NPS峰值的频率位置(fpeak)、平均SSIM(MSSIM)和平均GM(MGM)作为定量指标,以比较每个解剖区域、方案、算法、剂量水平和图像层厚的图像质量。
所有算法的图像噪声都与剂量有很强的(R2>0.99)幂律关系。对于腹部和胸部,随着ASiR-V强度的增加,fpeak从0.3(FBP)下降到0.15 mm-1(ASiR-V 100%),但对于所有DLIR水平,fpeak保持在0.3 mm-1。三个级别的DLIR分别产生与ASiR-V 40%、80%和100%相似的图像噪声水平。与ASiR-V相比,DLIR的MSSIM较低,但MGM较高,同时与成像噪声匹配。
图 图像与相应的SSIM图比较。典型剂量扫描的DLIR高vs ASiR-V 100%。与ASiR-V 100%相比,DLIR高显示出与FBP的相似性较低。最上面一行:腹部;中间一行:脑;底排:胸部。层厚(腹部5毫米,大脑和胸部2.5毫米)。CT图像显示窗口/水平:腹部(400/150),大脑(100/30),胸部(-100/1500)。SSIM图像显示的热色图范围在0和1之间
研究发现,在产生与ASiR-V相当的降噪效果的同时,DLIR在更真实的噪声纹理和更强的边缘增强与降低结构相似性之间表现出一种折中的保真度。在使用这种方法重建临床CT图像时,人们应该熟悉DLIR的一些独特的协议依赖行为。据我们所知,这是第一次在脑部扫描中评估DLIR以证明其行为与ASiR-V的相似性。
原文出处:
Kai Yang,Jinjin Cao,Nisanard Pisuchpen,et al.CT image quality evaluation in the age of deep learning: trade-off between functionality and fidelity.DOI:10.1007/s00330-022-09233-0
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言