影像组学在肿瘤研究中的应用

恶性肿瘤是严重威胁人类健康的重大疾病,早期诊断和早期治疗是提高临床治疗效果、降低肿瘤相关死亡率的关键。以组学为代表的分子生物学进展为肿瘤的诊断、治疗甚至预防提供了很多有价值的信息。这些信息的获取往往需要依赖于组织活检,但肿瘤异质性在一定程度上影响了活检的准确性。现在的医学图像已经从模拟图像发展为数字化图像,而且图像层厚越来越薄,分辨率越来越高,蕴藏的信息也越来越多。计算机技术的迅猛发展,使我们能够从图像中提取海量特征,进行精细的分析。2010年,Gillies等提出了影像组学的概念,即从图像的角度出发,从海量的医学影像数据中提取大量的定量特征,通过量化分析来提高诊断准确率并进行预测。与其他组学相比,影像组学不仅具有无创性,而且能够对肿瘤整体进行分析,有效避免了活检的取样误差。近年来,影像组学广泛应用于各类疾病,尤其是肿瘤的研究中,为肿瘤的早期诊断、准确分级和精准治疗提供了新的依据。

影像组学分析的基本步骤

影像组学分析的主要步骤包括图像采集、确认感兴趣区并进行图像分割、提取定量特征、分析定量特征、构建分类或预测模型。用于影像组学研究的图像需要有较高的分辨率,目前研究较多的是CTMRIPET图像。采集后的图像首先要进行自动器官分割、平滑、滤波等预处理。值得注意的是,图像扫描采用的机型、采集噪声、是否增强,图像重建时采用的视野、层厚、空间分辨率以及重建算法等均对影像组学特征有不同程度的影响,尤其在回顾性研究中,应当考虑到这些因素对结果的影响。

感兴趣区的勾画分为自动分割、半自动分割和人工分割。常用的半自动分割方法如"点击和自生长(click and grow)",即在靶区内选择种子点进行点击,然后自动向周围生长,到达病灶边缘时自动停止。种子点一般选在靶区中央,也可以选择多个种子点进行生长。这种分割方法省时省力,但当病灶出现粘连、与周围结构分界不清等情况时,分割结果可能不太理想,需要由专业的影像医师进一步修改。人工分割一般由影像医师对病灶进行逐层勾画,然后再将各个层面的分割结果进行融合,重建病灶的三维结构。这种分割方法较为准确,但不同医师之间存在差异性,且耗时费力,进行海量数据分析的可行性较差。近年来,基于深度学习的语义水平多器官全自动分割算法发展迅速,但全自动分割的输出结果大多仍需进行人工修订,因此使用全自动算法进行分割的影像组学研究数量有限。感兴趣区的选择根据研究目的而定,可以对病灶整体进行分割,也可以对病变的一部分进行分割,如分析肿瘤的实性部分或囊性部分。

影像组学特征是根据相应的算法,由计算机自动从勾画的感兴趣区中提取。不同研究机构所使用的特征不尽相同,对各个特征的定义也存在一定差异,但总体上可以分为4类,即形态学特征、一阶特征、二阶特征和高阶特征。形态学特征描述病变位置、大小等几何学参数。一阶特征描述感兴趣区内各体素灰度值的分布,通常是基于直方图分析,如病灶密度的平均值、偏差、峰度、偏度、熵等。二阶特征则描述病灶的空间分布复杂性,也称为纹理特征。如常用的Haralick方法,采用灰度共生矩阵,实际上相当于二维直方图。高阶特征则进一步加入了滤波器或高阶图像描述指标,常见的有拉普拉斯高斯滤波、小波滤波或小波分解以及分形维数等。这些特征取值多为连续性变量,部分为分类变量。

影像组学特征数目繁多,在进行统计分析前,首先要对各项特征进行初步筛选。能够用于统计分析的特征必须具有较高的可重复性、较好的区分度和较低的冗余度。在分析影像组学特征是否具有鉴别或预测价值时,应适当进行矫正,尽量避免假阳性结果的出现。在利用影像组学特征建立模型后,应采用独立的测试样本对结果进行验证。

影像组学与传统影像学的区别和联系

传统影像学分析主要分为两类:一类是对病灶进行定性描述,即语义影像学特征,通常由影像医师进行评价,如病灶形态是否规则、边缘是否光滑、密度是否均匀等。另一类是对病灶的半定量或定量测量,如测量感兴趣区的平均灰度值、平均表观弥散系数(apparent diffusion coefficient, ADC)等。

影像组学以整个肿瘤为研究对象,对病灶特征进行定量化分析,可以获取传统影像学无法提供的信息,具有一定的优势。首先,影像组学依赖于计算机进行图像分割和特征提取,病灶特征为量化指标,更加客观,不同操作者之间的差异仅来源于感兴趣区的差异,而不受操作者经验的限制。其次,图像的许多特征无法通过肉眼观察进行评价,影像组学则可通过计算机实现此类图像特征的提取,使获取的图像特征更为丰富。第三,影像组学实现了对图像的大批量高效自动处理,使得大数据分析和人工智能诊断成为可能。但目前影像组学仍有一定的局限性。首先,定量特征的提取仅局限于勾画的肿瘤范围内,而传统的影像学特征由医师进行评估,不仅可以对病灶本身,还可以对病灶周围结构的改变甚至远处转移的情况进行评价。其次,影像组学对图像质量及图像采集参数的一致性要求较高,如图像是否增强、层厚、层间隔等均有一定影响,而影像医师具有一定的自适应和判断能力,可以同时对增强前后的图像进行分析,对图像质量的要求相对较低。在既往研究中,传统影像学特征也显示出了较好的鉴别和预测价值。目前,影像组学并不能取代传统影像学,两者相辅相成、相互结合,可以提高对肿瘤的诊断和预测能力。

计算机科学家一直在对影像组学特征进行补充和完善。一方面是开发新的特征,如Grove等提出了与病灶形态有关的特征凸度(病灶实际边界与病灶凸壳的比值),反映病灶密度不均匀性的特征熵比(病灶中心熵与病灶边缘熵的比值);另一方面则致力于将传统语义影像学特征定量化、自动化,即通过开发相应的算法,使传统的语义影像学特征能够被计算机自动识别,并以统一的标准进行量化描述。

影像组学在肿瘤研究中的应用

肿瘤的发生和发展是一个复杂的过程,伴随的各种分子生物学变化会引起肿瘤形态结构和人体病理生理的改变。通过影像学检查,采用影像组学技术,不仅可以获取肿瘤的形态学信息,还可以了解肿瘤基因表达和代谢的变化,从不同层面揭示肿瘤的异质性,为临床提供全面量化的肿瘤表型,提高个体化的治疗选择。同时,还可以进行纵向分析,用于病变的监测、治疗后随访等。

1.肿瘤的筛查和诊断:

影像组学分析不仅有助于肿瘤的诊断,还可以对肿瘤的组织学分型进行鉴别,而且在肿瘤的早期筛查中也有广阔的应用前景。以肺结节为例。Wang等通过对CT图像进行纹理分析,认为惯性矩、熵、灰度自相关性、总熵值等特征有助于鉴别肺结节良恶性。Son等报道,病灶CT值的第75百分位数和熵可以有效区分浸润性肺腺癌与浸润前病变。Song等的研究显示,组学特征有助于预测肺腺癌中是否存在微乳头状生长方式,有助于预后判断和临床精准治疗方案的制订。Hawkins等通过对肺癌筛查基线图像的影像组学分析,确定了23个稳定的图像特征用于预测肺结节在1年、2年后发展成为肺癌的概率,准确性分别为80%79%,受试者工作特征曲线的曲线下面积(area under curve, AUC)分别为0.830.75

2.肿瘤的分级和分期:

肿瘤的准确分级和分期是选择治疗方案的基础,多个影像组学特征有助于鉴别低级别和高级别肿瘤。Zhang等的研究显示,应用弥散加权成像的纹理特征区分低级别和高级别膀胱癌的AUC、准确性、灵敏度和特异度分别为0.86182.9%78.4%87.1%。虽然影像组学分析只局限于勾画的感兴趣区内,但在肿瘤的分期中也有一定作用,可以基于原发肿瘤的特征预测淋巴结转移及远处转移情况,也可以基于淋巴结特征预测淋巴结的良恶性。Huang等分析了326例结直肠癌患者的门脉期CT图像,基于原发肿瘤提取了115个直方图和灰度共生矩阵特征,选取其中24个有效特征组成影像组学标签集,同时影像医师主观评价淋巴结良恶性,再结合患者癌胚抗原水平,三者共同构建预测诺模图,结果显示,该诺模图可以在术前较好预测结直肠癌淋巴结转移状态。Coroller等的研究显示,肺癌原发病灶的高通-高通-低通小波分解后的灰度值偏度、灰度共生矩阵-簇阴影、二维高斯拉普拉斯算子滤波后的灰度值偏度等特征与肺癌的远处转移有关。Bayanati等对肺癌患者的纵隔淋巴结进行组学分析,提示纹理特征和形态学特征相结合可以进行更为准确的N分期(AUC0.87)

3.肿瘤的治疗和预后:

肿瘤治疗后需要长期的随访评估。在此过程中,最关键的就是确定是否有复发或残存的病灶,以便及时给予相应的干预治疗。影像组学可以通过对治疗前、治疗中及治疗后的图像进行分析,预测治疗效果,为临床制定个体化、精准化的治疗方案提供帮助。

肺癌放疗后常伴随有放射性肺炎和放射性肺纤维化,通过常规的影像学特征难以与肿瘤复发鉴别。Li等通过对病灶信息进行深度挖掘,认为在进行立体定向放疗前,病灶的定位CT图像特征不仅可以预测肺癌放疗后的复发和转移,而且与患者的生存时间有关。临床医师在放疗前可以据此对患者进行危险分层,对于复发风险较高的患者可以选择增加放疗剂量、联合化疗或选择其他治疗方案等。放射性脑坏死与肿瘤复发也是临床鉴别难点。Pallavi等对治疗区域的多参数MRI图像进行了分析,结果显示,梯度直方图特征能够用于鉴别放射性脑坏死和脑肿瘤复发。在同步放化疗过程中,肺癌病灶的影像组学特征会发生变化,变化的差值对肿瘤复发和转移有预测作用。

4.肿瘤的分子生物学特征:

2016年中枢神经系统肿瘤WHO分类中,将肿瘤的组织学表型和基因特征相整合,共同进行肿瘤的诊断。如需在治疗前获取肿瘤相关的基因突变等信息,一般需要对病灶进行穿刺活检。由于肿瘤具有异质性,穿刺活检存在样本误差和假阴性等问题。影像组学则可以无创性获取肿瘤内部的丰富信息,通过对肿瘤整体的图像特征进行分析,预测肿瘤组织基因水平的特性,即为影像基因组学。Rios等通过多中心数据分析和验证认为,影像组学特征优于传统的影像学特征,能够预测表皮生长因子受体(epidermal growth factor receptor, EGFR)突变状态和Kras突变状态,并能区分EGFR突变阳性和Kras突变阳性病灶,证实了影像基因组学的可行性。Itakura等根据钆增强T1WI的影像组学特征,将脑胶质母细胞瘤分为3类,3类患者预后差异显著,且与不同的信号通路有关。提示影像组学特征能够反映不同的分子生物学活动,可为肿瘤靶向治疗方案的选择提供依据。

影像组学的发展趋势及存在的问题

近年来,影像组学的相关研究层出不穷,研究方向也更广、更深。首先,用于分析的图像从CT图像,已扩展到MRI、超声以及核医学图像。特征提取也不再局限于单一模态图像,而是多种模态图像特征的结合,即Habitats。其次,研究领域几乎涉及各类肿瘤,如脑胶质瘤、乳腺癌、胃肠道肿瘤、前列腺癌等,而且研究方向已从预测肿瘤的某些临床特征,如肿瘤的治疗疗效、生存时间等,进一步深入到预测肿瘤发生、发展的生物学基础,如p53通路、转化生长因子β受体信号转导、RNA聚合酶活性等。另外,在分析方法上,深度学习也已经兴起,自动提取特征的算法,如稀疏自编码器等逐渐应用。可以预见,随着研究的深入,影像组学相关研究成果将为肿瘤的精准治疗提供强有力的支持。未来,影像组学还面临许多挑战,如图像分割的准确性和可靠性、影像组学特征的标准化、大数据库的建立、多中心合作等。

影像组学是一个相对新兴的领域,还有一些关键性问题亟待解决。首先,图像分割是组学分析的基础,自动图像分割的准确性需要进一步提高。其次,组学特征的可靠性还有待进一步研究,某些特征的可重复性尚需明确,而且部分特征难以理解,无法通过现有医学知识进行解释。第三,影像组学分析对图像的质量要求较高,受扫描条件、伪影等影响明显。

总之,影像组学通过对医学图像进行深度挖掘,揭示肿瘤异质性,反映潜在的分子生物学变化,在肿瘤的早期诊断、精准治疗和预后评估等方面表现出巨大的潜力。随着影像组学的不断完善和发展,若与传统影像学指标以及其他临床特征相结合,将会在临床诊疗中发挥重要作用。