基于组织钙化可对乳腺肿瘤恶性程度进行评估,这对疾病诊断及了解肿瘤发展过程非常关键。传统的X光钼靶可提供钙化的整体形态但缺乏化学信息。自发拉曼光谱可提供详细的化学数据但缺乏空间分布信息。复旦大学研究人员Yifan
Yang等基于光谱和空间域分析,应用高光谱受激拉曼散射(SRS)显微术来提取微钙化的化学和形态特征。成像了23例患者的共211个钙化点,并用基于支持向量机(SVM)的分类算法对结果进行了分析。通过优化微钙化的化学及几何特征组合,使良性和恶性病例的区分精度能达到98.21%,召回率100.00%,相较基于纯光谱学或成像的方法有显著改善,可实现新鲜组织的快速准确评估。文章以“Microcalcification-based
Tumor Malignancy evaluation in Fresh BreastBiopsies with Hyperspectral
Stimulated Raman Scattering”为题发表于Analytical Chemistry。
背景
乳腺癌是女性癌症相关死亡的第二大原因,每年占所有癌症病例的23%。恶性肿瘤的早期和准确诊断可极大帮助降低发病率和死亡率,减轻患者经济负担。目前早期检测的主要筛查工具是X光钼靶(X-ray
mammography),其中钙化被认为是了解和评估疾病的重要特征。这些钙沉积物中包含丰富的化学成分混合物(如磷酸盐、草酸盐和碳酸盐),以及与肿瘤发展和恶性肿瘤密切相关的各种形态信息(大小、形状和分布)。然而X光钼靶仅能提供钙化的形态学特征而没有化学成分信息,并不足以评估肿瘤状态。因此结合乳腺钙化的化学和组织学特征的方法对于提高诊断准确性至关重要。
基于分子键振动的指纹光谱特征的拉曼光谱可提供卓越的化学识别能力。与用于表征乳房钙化的其他光学方法相比,拉曼散射的特点在于揭示内在的组织和生物矿物的化学成分。已经证明根据草酸钙(CAO)、羟基磷灰石(Hap)和碳酸盐的光谱特征,拉曼光谱可区分不同类型乳房钙化。已知I型钙化是透明的,由CAO晶体组成,这种钙化只发现于良性导管囊肿中,癌中很少发现;而II型钙化是不透明的,主要由钙Hap组成,钙Hap存在于良性和恶性疾病中,但Hap中碳酸盐的丰度显示与恶性肿瘤呈负相关。此外钙化中的蛋白质水平也与恶性肿瘤相关。但自发拉曼散射截面成像速度过慢(约每帧一小时),不能提供足够的被认为与疾病状态相关的形态学信息。如根据乳腺成像报告和数据系统(BI-RADS),放射技师会将“爆米花样”钙化物归入低风险类别。没有空间分辨率的情况下,自发拉曼光谱仅能提供关于异质钙化复合体的空间平均化学信息。
为将光谱和空间域信息连接起来,研究人员应用高光谱受激拉曼散射(hyperspectral
stimulated Raman scattering,
SRS)显微术来研究微钙化。作为一种新的化学成像方式,SRS信号强度和成像速度提高了几个数量级,同时保持了化学分析的不失真谱线形状。与传统自发拉曼散射不同,当泵浦(ωp)和斯托克斯脉冲(ωs)同时与键振动(频率Ω)相互作用时,SRS从受激发射过程中得到增益,键振动与两个激光束之间的拍频共振(Ω = ωp - ωs)。SRS在各研究领域显示出广泛的应用潜力,特别是生物和生物医学研究领域,包括肿瘤的无标记诊断、化学分析、细胞代谢、药物输送、生物燃料等。当进一步与机器学习算法结合时,SRS在自动与智能诊断的快速无标记组织学应用方面显示出巨大成功。虽然已有研究尝试过用SRS光谱分析在薄组织切片中评估乳房钙化,但还没有过将化学和组织病理学信息集成到一起用在肿瘤评估中。另外新鲜组织活检更适合形态学成像和特征提取,没有通常在冷冻组织切片中出现的切片及冷冻伪影。因此对新鲜组织中的微钙化进行高光谱SRS成像,将为乳腺肿瘤的恶性程度评估提供新思路。
本文使用高光谱SRS评估良性和恶性乳腺病变的各种微钙化中,肿瘤恶性和多维SRS特征之间的相关性。从新鲜人乳腺活检样品中获取钙化的指纹SRS光谱(900-1100cm-1)和化学选择性图像。使用光谱分析提取检测窗口内的主要化学成分(Hap、碳酸盐和蛋白质),处理图像以提取每个钙化点的主要形态特征(几何和纹理)。后,利用支持向量机(SVM)对乳腺病变进行分类,通过组合并优化化学和形态学特征,使分类精度得到显著提高。
结果
01-新鲜乳腺活检的SRS成像
全乳X光钼靶成像后,显示出了分散钙化(图1A左),芯针抽吸可能包含丰富钙化的病变进行组织活检。在SRS显微镜下,可对不同化学成分进行选择性成像以揭示其空间分布。在高频C-H拉伸区可以看到整个组织的组织病理学(图1A右),拉曼频率2845cm-1(CH2拉伸)和2930cm-1(CH3拉伸)处可见脂质(绿色)和蛋白质(蓝色)分布,而在指纹频率区,962cm-1(白色)处可检测到乳腺组织内钙化物(Hap)的分布。同时采用SHG通道对胶原纤维成像(红色)。放大的微钙化部位、细胞区域和结缔胶原纤维等细节处可很容易地观察到乳房组织内的强烈不均匀性(图1B)。
图1 乳腺活检的典型高光谱SRS成像结果。(A)从X光钼靶区域获取的活检样本多色SRS图像。(B)图A三处放大,显示有钙化、密集细胞和富含脂质(绿色)、蛋白质(蓝色)、胶原纤维(红色)和Hap(白色)的结缔组织区域。(C)乳腺组织、标准BSA和Hap中微钙化的SRS光谱。
除每个特定化学图像中显示的空间信息之外,超光谱SRS还可提供任何给定感兴趣空间区域的光谱信息。图1C为具有四个主要拉曼活性峰的钙化的典型SRS光谱。通过比较纯Hap和BSA的SRS光谱,可确定钙化主要由Hap组成(962cm-1处有代表性的磷脂振动模式),并混合有一定量的蛋白质(1005 cm-1和1032cm-1处的特征苯丙氨酸环呼吸振动模式)。约1072cm-1处的峰可归因于磷灰石复合物中嵌入的碳酸盐(CO32-)的υ1振动模式,与先前的研究一致。已知碳酸盐取代会影响Hap的拉曼光谱,并且良性和恶性乳腺组织微钙化物中的碳酸盐丰度存在差异。这些微钙化的光谱特征为基于SRS光谱的化学成分分析奠定了基础。因为Ⅰ型钙化仅存在于良性病例中,且检测频率窗口(900-1100cm-1)中没有出现草酸钙,所以本研究中仅关注Ⅱ型钙化的诊断价值。
为收集和分析大量的微钙化点,首先需要在新鲜活检组织中有效地搜索它们。利用单通道SRS以962cm-1成像快速定位富含Hap的钙化点,图2展示了良性和恶性组织中嵌入的微钙化图像,同时还有脂质、蛋白质和胶原纤维的化学图像用以说明整个组织结构。这些图像可能已经显示出明显的形态差异,良性钙化显得更密集和聚集,而恶性钙化则显得更分散,有大量更小的微结构(毛玻璃样)。在900-1100cm-1光谱范围内逐一对这些钙化点进行高光谱SRS扫描。在所有23例患者中,共研究了211个钙化点(101个良性,110个恶性),含用于定量分析的光谱和形态学信息。
图2 带有微钙化的乳腺组织的典型SRS图像。A、B为恶性组织,C、D为良性组织。绿色,脂质;蓝色,蛋白质;红色,胶原纤维;白色,Hap。
02-微钙化点的光谱和形态特征提取
首先根据钙化的SRS光谱分析了其中的化学成分。图3A为标准BSA、Hap、裸组织以及良性和恶性钙化的自发拉曼光谱,用以确认峰值分配。良性和恶性钙化的SRS光谱如图3B和C。可见每个光谱由四个窄拉曼峰组成,Hap(962cm-1)、Phe 1(1005cm-1)、Phe 2(1032cm-1)和CO32-(1072cm-1),位于宽XPM背景光谱之上。拟合所有上述峰,并提取与肿瘤恶性相关的三种主要化学物质Hap、蛋白质和碳酸钙的相对丰度。如良性和恶性病例间,蛋白质与Hap(Phe1/Hap)的比率、碳酸盐与蛋白质(CO32-/Phe 1)的比率有显著差异(图3B和C)。良性钙化中的碳酸盐含量往往较高,而恶性钙化中总蛋白质水平似乎更丰富。
图3 钙化乳腺组织的自发和受激拉曼光谱分析。(A)标准BSA、Hap、裸组织和良性及恶性乳腺组织钙化的自发拉曼光谱。(B,C)良性和恶性钙化的SRS光谱,拟合峰值代表Hap、Phe1、Phe2、CO32和XPM背景。
基于Hap的SRS图像定量表征了Ⅱ型钙化的形态学特征。良性(图4A)和恶性(图4B)钙化的典型强度图进一步转换为二值图像,以提取相关的几何特征,包括圆形度、面积、周长和傅立叶描述子。统计结果表明这些特征在良性和恶性病例间表现出显著差异(图4C和D)。例如,良性钙化倾向于表现出面积更大、表面更光滑、圆形度更高和傅立叶描述子,与SRS图像中直接观察到的一致。X光钼靶显示在大钙化中有类似的特征,但很难观察到微钙化。此外纹理特征也可以从原始强度图像中提取(无需二进制转换),但诊断价值并不高。
图4 从钙化的SRS图像中提取形态学特征。(A,B)良性和恶性钙化结果二值化的 SRS图像。(C,D)所有测量乳房钙化中提取的两种形态特征的统计分布的箱线图。
03-功能排序和选择
从SRS光谱图像中提取钙化点的所有特征后,包括化学和形态学特征。Table 1列出了所有18个特征(2个光谱、8个几何和8个纹理)。其中一些特征的区分性较高,如平均面积和化学比率。因此需要选择信息量大的特征,减少冗余信息,实现佳计算效率。
应用RFE算法对这些特征进行排序,如Table
1后一列所示。似乎几何特征总体上排名高,而纹理特征排名较低。为找出区分乳腺恶行肿瘤的佳特征组合,测试了五组特征进行训练与验证,即2F、6F、8F、10F和18F。2F代表两种化学/光谱特征。6F代表纯几何特征,包括五的特征。8F包含光谱和几何特征,均在前八排名内。10F开始包含纹理特征。18F包含所有特征。旨在寻找产生佳评估结果的特征组合。
04-基于机器学习的微钙化点SRS评价
在上述特征组合选择的基础上,应用SVM对所有实验数据进行训练与验证,以医院的诊断结果作为基本事实。训练与验证数据集以两种方式进行比较:基于钙化和基于患者。使用了不同的验证方法:LOONCV和10倍嵌套交叉验证,并根据准确性、度、召回率和F评分生成结果。
训练和验证结果如图5。总体而言,基于患者的数据集结果比基于钙化的数据集结果更差,表明后者中存在过度拟合,因为同一患者的钙化数据在训练集及验证集之间交叉;因此基于病人的方法更适合。此外LOONCV性能好,训练集比10倍方法更大,这特别适合于小规模数据集。此外SVM训练包含更多的特征并不一定会产生更高的评估精度。虽然从2F到8F的验证结果越来越好,但当特征数进一步增加到10F和18F时,验证结果通常会下降。详细观察表明,纯化学特征(2F)预测结果适中(准确率82.94%;精度85.58%),而纯几何特征(6F)效果更好(准确率95.26%;精度92.37%),二者的组合(8F)结果好(准确率99.05%;精度98.21%)(图5A和B)。图5C和D显示了基于钙化和基于患者的LOONCV结果的ROC曲线,证明当包含化学和几何特征时该SVM模型的评估性能近乎完美。
图5 不同特征组合的SVM模型评价结果。(A)基于钙化和(B)基于患者的训练和验证结果,包括纯化学、纯形态学、10倍和LOONCV的组合特征。每个雷达图有八个轴:精度、召回率、度和训练与验证结果的F分数。误差线以相应的颜色显示。(C)基于钙化和(D)基于患者的SVM模型的ROC曲线。
纯形态特征和组合组的曲线下面积(AUC)值都达到了同样的好结果,接近理想值1,这主要是因为它们近的高召回率(灵敏度)。意味着两种模型产生的假阴性事件可以忽略不计。但完整的验证结果可更全面地评估这些模型,表明组合特征确实表现好,尤其是在精度和准确度方面(图5A和B)。而包含纹理特征并不能帮助改善验证结果,可能表明钙化的纹理与疾病状态的相关性要小得多。
结论
本研究发现,整合钙化的化学和形态学信息可显著提高乳腺肿瘤恶性评价效果,这也表明微钙化的化学组成和结构特征是相互关联的。钙沉积的形成过程与钙化复合体的具体组成有关,进一步由不同疾病状态的潜在生化性质确定。SRS高光谱成像提取的特征包含有关钙化的多维信息,可能会帮助对疾病进行准确分类。未来可侧重于将这些SRS特征以较大规模数据集与不同类型和级别的乳腺肿瘤相关联,以及开发相应的机器学习算法。
利用新鲜的活检样本快速评估肿瘤恶性程度对术中诊断有重要实用价值。传统的组织病理受限于耗时的组织制备程序。SRS无需处理样本即可提供天然组织的内在分子对比和组织结构,以无标记的方式高速得到化学和形态学信息。光学技术和深度学习算法也不断推进着超光谱SRS显微术的发展,这对肿瘤评估中微钙化的快速分析大有裨益。另外手持式SRS检测和小型化设备提高了实用性,使该技术有望向临床转化。
参考文献:Yifan
Yang, Yinlong Yang, etal. Microcalcification based Tumor Malignancy
evaluation in Fresh Breast Biopsies with Hyperspectral Stimulated Raman
Scattering. Analytical Chemistry. 2021,93,15,6223-6231.