代谢biomarker筛选是疾病早期筛查和预后评估的重要手段,一组有效的代谢Biomarker筛选是一个漫长且艰难的过程。从临床样本的选择、队列分组到实验思路设计再到大量的数据分析均是生物标志物筛选缺一不可的关键环节。到底应该如何筛选并对临床样本进行分组?如何设计严谨的筛选-验证实验?如何评估标志物的诊断效能?本期我们选择5篇临床biomarker筛选文章,看完这个系列,相信以上问题都会迎刃而解。
临床biomarker专题
文章1. 增强HBV-ACLF预后的生物标志物筛选
文章2. 频发型与偶发型痛风患者的血清代谢标志物新发现
文章3. 结直肠癌的基于菌群和血清代谢物的诊断模型建立
文章4. 脂质组学生物标志物:尿双酚A暴露与结直肠癌之间的潜在介质
文章5. 肝细胞癌早期检测的大规模、多中心血清代谢物生物标志物鉴定
文献解读 | (IF=13.3)肝细胞癌早期检测的大规模、多中心血清代谢物生物标志物鉴定研究
肝细胞癌(hepatocellular carcinoma, HCC)是最致命的恶性肿瘤之一,全球约有700万人死亡,全球约50%的新发病例和死亡病例发生在中国。尽管危险因素(如肝硬化)已得到充分认识,由于早期隐性临床症状和肝硬化的鉴别诊断困难,HCC在高危人群中的早期诊断仍然具有挑战性。影像学方法和血清生物标志物(如:α-胎蛋白(a-fetoprotein, AFP)对HCC仍然具有局限性因此,仍然迫切需要发现新的筛查HCC的生物标志物。
实验设计
图1 实验设计 (NC:正常对照;Cir:肝硬化;CHB:慢性乙型肝炎;HCC:肝细胞癌;S-HCC:小肝细胞癌;GSC:胃癌;ICC:肝内胆管细胞癌)
研究结果
HCC潜在代谢生物标志物的确定
本研究通过纳入1448名受试者,其中训练集108个样本,测试集684个样本,验证集656个样本(图1)。收集禁食过夜后临床血清样本,利用LC-MS技术,进行非靶向代谢组学分析,数据结果进行PCA分析显示:NC、Cir和HCC组之间存在显著的系统代谢差异(图2),结合之前的研究以及本实验室开发得数据库共确定了239个差异代谢物进行下一步分析。
图2. 基于发现集(A)和测试集(B)的PCA分析得分图
PLS-DA评分图(图3 A)显示这些组之间存在明显的分离且不催在过拟合现象。利用多元变量统计分析(VIP > 1.0)和单元变量统计分析(p < 0.05, FDP < 0.05)(图3 B、C),筛选到17个候选生物标志物。
图3. A. 基于发现集中NC、Cir和HCC组的PLS-DA评分图 B. 多元变量统计结果 C. 单变量统计分析结果发现组、测试组和验证组中确定的潜在生物标志物ph -色氨酸(D)和GCA (E)的血清相对浓度。
使用684个个体组成的独立测试集(图1)用来评估17个候选生物标志物的可靠性,并筛选生物标志物。这些潜在的生物标志物必须满足以下标准:
1) 在四组比较(HCC/NC, HCC/Cir, S-HCC/NC, S-HCC/Cir)中存在显著差异;
2) 在这些比较组中其变化趋势与发现集中保持一致。
最终,保留了8种代谢物:苯丙酰色氨酸(phenylalanyl-tryptophan, Phe-Trp)、糖胆酸盐(glycocholate, GCA)、牛磺胆酸盐、溶血磷脂酰乙醇胺18:2 (LPE 18:2)、LPE 20:5、LPE 22:4、胆碱和牛磺酸。采用二元逻辑回归分析和正演逐步法(Wald)优化算法,利用这8种潜在代谢物生物标志物构建最佳模型。最后,将Phe-Trp和GCA联合(图3 D, E)定义为区分HCC患者和非HCC患者的理想生物标志物panel。
AUC结果也表明,在发现集和测试集中,HCC与Cir的区分中该物质组合(AUC=0.930和0.892)比AFP(AUC=0.657和0.725)的区分能力更优(表1)。
表1 血清代谢物组(2-Meta)、AFP和两者联合的ROC分析
HCC生物标志物panel的验证
为了验证该血清代谢物组检测HCC的诊断潜力,使用(验证队列1)572个样本(含150名慢性乙型肝炎患者)进行靶向代谢组学分析,测定血清Phe-Trp和GCA浓度,通过logistic回归模型建立代谢组。
发现在发现集和测试集中,该生物标志物 panel(AUC=0.807对0.650)在区分HCC和高危人群(cirrhosis, Cir)中的S-HCC方面表现出比AFP(AUC=0.753对0.676)更高的诊断性能(表1)。且在AFP假阴性的HCC和S-HCC (AFP < 20 ng/mL)患者中,使用代谢物组准确诊断出AFP的比例分别为90.5%和75.0%(图4 C)。
图4.血清代谢物(2-Meta)、AFP及二者在HCC和S-HCC诊断中的价值
采用84个样本的验证队列2进一步评价上述结果构建的生物标志物 panel。如表3所示,在临床诊断前发生HCC的受试者与未发生HCC的受试者中该panel (80.0~70.3%)较AFP (40.0~26.2%)具有更高的灵敏度 。
此外,该panel对临床前HCC诊断的敏感性随时间间隔从3年到1年保持上升趋势(从71.4%到80.0%),与AFP联合使用其特异性略有提高,但与单独使用该panel相比,敏感性保持相似(表3)。此外,在临床诊断样本前1年,临床前HCC个体与风险对照组相比,Phe-Trp和GCA水平发生了显著变化,其变化与发现集和测试集中HCC受试者与对照组相比的变化一致(图3 D,E)。这些结果表明,在临床诊断之前,该panel 有可能从高危人群中筛查临床前HCC。
表3. 验证组队列2中血清代谢物组(2- meta)、AFP或两者在临床诊断前预测HCC的表现
将胃癌(gastric cancer, GSC)和肝内胆管癌(intrahepatic cholangiocarcinoma, ICC)纳入本研究。与GSC或ICC组比较,血清中HCC组中Phe-Trp显著下降,而HCC组中GCA水平显著升高(图3 D, E)。此外,该panel将HCC患者与AUC分别为0.946、0.829的GSC或ICC患者区分开来,表明该panel是HCC特异性的。
生物标志物组与临床特征和HCC的关系
对所有差异代谢物的通路分析显示,HCC诱导的代谢紊乱主要与初级胆汁酸生物合成有关:甘氨酸、丝氨酸和苏氨酸代谢;色氨酸代谢;牛磺酸和次牛磺酸代谢等。
对这些差异代谢物的含量与临床特征进行相关性分析,发现几种胆汁酸水平与天冬氨酸转氨酶、丙氨酸转氨酶、总胆红素、直接胆红素和间接胆红素水平呈正相关,与总蛋白和白蛋白水平负相关。而与Phe-Trp、血清素、肌醇、胆碱、牛磺酸等呈反比关系。显然,这些不同代谢物的水平与BMI、AFP水平、年龄和性别无关(图5 A)。
为了进一步揭示这些标志物在HCC患者中的生物学相关性, 我们研究了配对HCT、ANT和DNT中Phe-Trp和GCA的水平 。在我们之前的研究中,有50例HCC患者的标本。与DNT相比,HCT中Phe-Trp水平显著降低(图5 B),且为伴随着色氨酸和苯丙氨酸水平的升高。几种胆汁酸的水平在肿瘤中显著降低组织(图5 C)。
图5. 了解HCC诊断中生物标志物的生物学相关性
结论
1. 这项研究从多个中心招募了1448名受试者;
2. 进行代谢组学LC-MS/MS检测,并结合多变量和单变量的统计分析,鉴定验证到了一组生物标志物:Phe-Trp和GCA,能够显著提升HCC的诊断敏感度和特异性;
3. 该标志物组随时间表现出的诊断敏感度增加趋势符合HCC的临床进展,并且敏感性和特异性与AFP互补,可在临床诊断前筛查来自高危人群的临床前HCC。