密歇根大学 2016
摘要
设计了一种深度学习卷积神经网络(DLCNN),用于将在预筛选阶段检测到的微钙化候选物区分为在计算机辅助检测(CAD)系统中用于聚集微钙化的真正钙化或假阳性。从由多尺度双边滤波重建的数字乳房断层合成体积生成的平面投影图像中提取微钙化候选者正则化的同时代数重建技术。对于DLCNN的训练和测试,对于数据集手动标记真正的微钙化点,并且在排除真正的微钙化之后,从CAD系统鉴定的候选对象在预筛选中获得假阳性。通过改变卷积层中的滤波器数目,滤波器核心大小和梯度计算参数来选择DLCNN体系结构,得到216个组合的参数空间。在所研究的参数空间内采用穷举网格搜索方法来选择最佳的体系结构,并以受试者工作特性曲线(AUC)下的面积为指标进行指导。分析了不同类别参数空间的影响。选定的DLCNN与我们以前设计的CNN架构进行了比较。 CNN和DLCNN的AUC分别为0.89和0.93。改善有统计学意义(p <0.05)。
1.引言
卷积神经网络(CNN)以前已被用于在计算机辅助检测(CAD)中识别用于屏幕膜乳房摄影,1数字乳腺摄影(DM)2和数字乳腺断层合成(DBT)3-5的成簇微钙化的微钙化,来自乳房X线照相的正常乳房组织的肿块[6]。CNN已经被证明可用于区分微小钙化与纤维组织结构或金属夹之间的平面间伪影。随着近年来计算能力和数据存储成本的不断提高,大规模数据样本训练巨大的CNN结构成为可能。深度学习CNN(DLCNN)方法已经被证明可以有效地识别各种类型的图像中的模式[7-11]。与传统的CNN架构相比,DLCNN通过更多的层和节点来学习复杂的模式。在本研究中,我们评估了DLCNN在DBT中CAD系统的真假微钙化分化中的应用。我们选择了DLCNN的最佳体系结构,分析了参数对分类性能的影响,并与之前选择的用于屏幕胶片乳房X线照片和DM的CNN体系结构相比较。
2 方法
2.1数据集
在这项研究中,使用了64个DBT病例,并有微小的钙化灶。数据集包含64个颅尾(CC)和63个侧偏(MLO)视图。使用多尺度双边滤波(MSBF)正则化的同时代数重建技(SART)重建DBT体积,平面分辨率为0.1 mm×0.1 mm,切片间距为1 mm。DBT体积分解为使用拉普拉斯金字塔分解的高频和低频量,并且每个切片的高频分量被双边滤波去噪。高频体积的最大强度投影产生平面投影(PPJ)图像。从PPJ图像中提取以预筛选阶段中识别的每个个体微钙化候选为中心的16×16像素的感兴趣区域(ROI)。
2.2计算机辅助检测系统
我们的CAD系统的处理步骤包括使用迭代阈值和区域增长来检测微钙化候选者,其次是聚类和假正减少(FP)。我们以前选择的CNN架构具有两个隐藏层,输入和输出层固定在一个节点组。 隐含层分别由12个和8个滤波器核大小为5和3的节点组构成。本文将CNN架构的分类性能与DLCNN的性能进行了比较。
为了对CNN和DLCNN进行训练和测试,数据集中的真正微钙化由乳房成像经验丰富的医学物理学家手动标记。 将由CAD系统检测到的与手动标记的位置不重叠的微钙化候选物用作FP对象。 对象被分成独立的训练和测试集。 为了增加训练样本的种类,每个真实微钙化的ROI被旋转并翻转以产生八种模式。 由于FP对象比真正的微钙化点多得多,所以FP对象是从可用的FP中随机抽取的,因此真假对象的ROI近似平衡。 共有4808个由2352个TP和2440个FP组成的对象被用于训练,并且使用了包括414个TP和1806个FP的2220个对象用于测试。 以微钙化和FP对象为中心的ROI示例如图1所示。
2.3选择最佳的架构
图1显示了用于这项研究的DLCNN16的结构。 2.由于图像模式在我们的应用中相对简单,训练样本数量有限,我们选择了一个简单的结构,只有两个卷积层,连接到两个局部连接层和一个完全连接层。大小为2的最大汇聚层将第一卷积层的输出下采样到大小的一半。在每个卷积层之后实施标准化层以补偿由于微钙化和金属物体造成的对比度的可能的大的变化。参数搜索空间包括表1中列出的参数范围。使用详尽的网格搜索方法来选择DLCNN的最佳体系结构。根据表1中的参数组合,共有216个DLCNN体系结构进行了培训和测试。 C1,C2,L1和L2的滤波器数目固定为16或32或64.部分和参数影响反向传播阶段的权重梯度计算。参数()的可能组合取决于滤波器的输出大小(),由given*给出,= 0;例如,对于32的输出大小,参数可以是1,2,4,8,16或32。
结果
根据受试者工作特征(ROC)曲线下面积(AUC)比较训练的DLCNN和CNN对测试集中真实微钙化和假阳性分类的表现。 对于搜索空间中所有可能的参数组合,按其值从低到高排序的AUC绘制在图3中。 对于(32,32,32,32)滤波器的数量,对于两个卷积层,滤波器核大小分别为5和5,部分和值分别为18,16,得到最佳的AUC为0.933。 对于相同的组合,部分和参数的变化如图4所示。 图5分析了每类滤波器的AUC变化。图6比较了CNN和DLCNN测试集的ROC曲线。 改善有统计学意义(p <0.05)。
4.讨论与结论
选择DLCNN体系结构并不是一个微不足道的问题,因为每个参数集的训练和测试都有大量的参数和长的计算时间。我们通过为DBT中的微钙化检测问题选择固定数量的层的参数范围和组合来限制搜索空间的大小。所选参数空间允许穷举搜索最优DLCNN体系结构。观察到,随着过滤器数量的增加,AUC的变化也增加。当部分和参数变化时,没有观察到趋势,这可能是由于机器学习方法的非线性性质。今后,我们计划增加微钙化的样本量,并探索自动优化方法,如遗传算法或模拟退火。我们还将扩大参数搜索空间,以包括不同层次的滤波器数量的变化。已经在重建的体积,18-22投影视图,21,23-25 PPJ图像,3,26或上述方法的组合中开发了用于DBT中的微钙化团块的CAD的实现。我们将探索DLCNN在不同的图像的类型。