客戶單位: 廈門大學(xué)附屬中山醫(yī)院
期刊:Theranostics
影響因子:8.579
發(fā)表時(shí)間:2020.07.09
伯豪提供服務(wù): 機(jī)器學(xué)習(xí)建模和免疫浸潤(rùn)分析
具有完善基因表達(dá)數(shù)據(jù)和表型數(shù)據(jù)的大規(guī)模公共隊(duì)列為開發(fā)腫瘤預(yù)后標(biāo)志提供了可能。近年來,機(jī)器學(xué)習(xí)作為人工智能(AI)的分支,已經(jīng)被成功用于建立腫瘤患者預(yù)后和治療預(yù)測(cè)的模型。與此同時(shí),近年來人們逐漸了解到腫瘤微環(huán)境的復(fù)雜性和多樣性,腫瘤微環(huán)境與腫瘤細(xì)胞相互作用,共同介導(dǎo)了腫瘤的免疫耐受,從而對(duì)腫瘤進(jìn)程及治療產(chǎn)生重要影響。在這項(xiàng)研究中,作者整合了多個(gè)隊(duì)列和基因表達(dá)數(shù)據(jù),開發(fā)驗(yàn)證了一個(gè)基于基因集的胃癌預(yù)后特征(GPSGC),然后進(jìn)一步分析 GPSGC 風(fēng)險(xiǎn)評(píng)分與腫瘤微環(huán)境的關(guān)系,探討了 GPSGC 評(píng)分相關(guān)的生存機(jī)制,并發(fā)現(xiàn)了潛在的治療靶點(diǎn)。
01. 預(yù)后模型的建立
(1)發(fā)現(xiàn)階段:對(duì) TCGA 和 ACRG 數(shù)據(jù)庫(kù)中的癌和癌旁進(jìn)行基因差異表達(dá)分析,進(jìn)一步通過 Cox 回歸分析初步獲得 22 個(gè)候選 marker。
(2)訓(xùn)練階段:進(jìn)一步應(yīng)用 Stepwise Cox regression multivariate 分析篩選出基因組合,構(gòu)建優(yōu)秀的多元 Cox 回歸模型。
risk score = (0.14121 * expression of VCAN) + (0.19095* expression of CLIP4) + (0.13633 * expression of MATN3)
利用 X -tile 軟件獲得的 cutoff(0.15),從而將 TCGA-STAD 和 ACRG 隊(duì)列中的患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。在 TCGA 隊(duì)列中,高風(fēng)險(xiǎn)評(píng)分患者(22.8%)的總生存率(OS)較低風(fēng)險(xiǎn)評(píng)分患者(77.2%)短(HR=2.296;95%CI:1.513-3.485;P<0.0001);同樣的,在 ACRG 隊(duì)列中,高風(fēng)險(xiǎn)患者(30.7%)的 OS 較低風(fēng)險(xiǎn)患者(69.3%)短(HR=2.659;95%CI:1.836-3.849;P<0.0001)。
(3)驗(yàn)證階段:為了確定 GPSGC 是否穩(wěn)健,作者在三個(gè)獨(dú)立的 GEO 隊(duì)列中評(píng)估了 GPSGC 的性能,共包含 1057 名患者。與訓(xùn)練隊(duì)列的結(jié)果一致,根據(jù) GPSGC 被分配到高風(fēng)險(xiǎn)組的患者在多個(gè) GEO 驗(yàn)證隊(duì)列中的 OS 或 RFS 明顯比那些被分配到低風(fēng)險(xiǎn)組的患者差。
為了探討 GPSGC 的預(yù)后價(jià)值是否獨(dú)立于其他臨床因素,作者進(jìn)行了多因素 Cox 回歸分析,結(jié)果表明,GPSGC 可以作為患者生存結(jié)局的獨(dú)立預(yù)測(cè)因子,從而證實(shí)了其獨(dú)立預(yù)測(cè) GC 預(yù)后的穩(wěn)健性。

基于多變量 Cox 分析,生成了一個(gè)整合了 GPSGC 和其他臨床變量的列線圖,以預(yù)測(cè) TCGA-STAD 和 ACRG 訓(xùn)練隊(duì)列的 GC 患者 3 年和 5 年總生存率的概率。

02. 免疫微環(huán)境與 GPSGC 風(fēng)險(xiǎn)評(píng)分及預(yù)后的關(guān)系
腫瘤微環(huán)境(TME)由細(xì)胞外基質(zhì)(ECM)、間質(zhì)細(xì)胞、免疫 / 炎癥細(xì)胞和分泌因子組成,與腫瘤的進(jìn)展和治療反應(yīng)密切相關(guān)。上述 GPSGC 風(fēng)險(xiǎn)模型中,VCAN、CLIP4 和 MATN3 蛋白的組織分布和細(xì)胞定位表明它們與腫瘤微環(huán)境(TME)有關(guān)。
(1)TME subcomponent analysis
為了進(jìn)一步探討 GPSGC 背后的潛在機(jī)制,首先基于 ESTIMATE 算法將 TME 分為基質(zhì)和免疫亞組分,并通過 ssGSEA 確定基質(zhì)和免疫評(píng)分。Pearson 相關(guān)分析顯示,基質(zhì)評(píng)分與 GPSGC 風(fēng)險(xiǎn)評(píng)分呈顯著正相關(guān)(r=0.645;P<1.0×10-6;)。此外,而基質(zhì)評(píng)分高的 GC 患者總體生存率比基質(zhì)評(píng)分低的患者差(HR=1.351;95%CI:1.107-1.647;P=0.0031)。

(2)TME cell type analysis
對(duì)于 TME 細(xì)胞類型分析,基于 xCell 算法預(yù)測(cè) 64 種 TME 細(xì)胞類型的比例,并通過 ssGSEA 確定每種細(xì)胞類型的富集分?jǐn)?shù)。在 64 種 TME 細(xì)胞類型中,與 OS(log-rank test, P <0.05)和 GPSGC 風(fēng)險(xiǎn)評(píng)分(Pearson’s correlation test, |r| ≥ 0.40, P < 0.05)顯著相關(guān)的細(xì)胞共有 9 種類型。值得注意的是,占比大的五種間質(zhì)細(xì)胞均與預(yù)后和 GPSGC 風(fēng)險(xiǎn)評(píng)分呈正相關(guān)。

(3)Panimmune gene set analysis
在泛免疫基因集分析中,利用 GSVA 對(duì) 110 條免疫調(diào)節(jié)相關(guān)通路的富集分?jǐn)?shù)進(jìn)行了估計(jì),篩選與 OS(log-rank test, P <0.05)和 GPSGC 風(fēng)險(xiǎn)評(píng)分(Pearson’s correlation test, |r| ≥ 0.40, P < 0.05)顯著相關(guān)的基因集,得到 10 個(gè)泛免疫基因集,其中 8 個(gè)與不良結(jié)局和 GPSGC 風(fēng)險(xiǎn)評(píng)分呈正相關(guān)。

(4)immunomodulatory gene analysis
為了確定 GPSGC 相關(guān)的特異性分子靶點(diǎn),在整個(gè)隊(duì)列中分析了 60 個(gè)免疫調(diào)節(jié)基因與 GPSGC 風(fēng)險(xiǎn)評(píng)分的相關(guān)性(Pearson’s correlation test, |r| ≥ 0.40, P <0.05);。OS 分析進(jìn)一步表明,只有三個(gè)免疫調(diào)節(jié)基因 VEGFB、TGFβ1 和 ENTPD1 顯著與不良結(jié)果相關(guān)。

03.GPSGC 和治療靶點(diǎn)的實(shí)驗(yàn)驗(yàn)證
由于所有與 GPSGC 和治療靶點(diǎn)相關(guān)的蛋白質(zhì)都具有重要的生物學(xué)功能,進(jìn)一步使用組織微陣列和多重?zé)晒饷庖呓M織化學(xué)(mfIHC)在蛋白質(zhì)水平上進(jìn)行實(shí)驗(yàn)驗(yàn)證。在 186 例 GC 患者的組織微陣列中,GPSGC 有效地將 59 名患者(31.7%)分為高危組,127 名患者(68.3%)分為低風(fēng)險(xiǎn)組。OS 分析還證明治療靶點(diǎn) TGFβ1 和 VEGFB 的蛋白表達(dá)與不良預(yù)后顯著相關(guān)。VCAN、CLIP4 和 MATN3 的表達(dá)水平和與治療靶點(diǎn) TGFβ1 和 VEGFB 的表達(dá)顯著相關(guān)。Pearson 相關(guān)分析顯示,GPSGC 風(fēng)險(xiǎn)評(píng)分與 TGFβ1 蛋白表達(dá)和 VEGFB 蛋白表達(dá)呈強(qiáng)正相關(guān)。

文章亮點(diǎn)總結(jié):
1、數(shù)據(jù)庫(kù)挖掘結(jié)合實(shí)驗(yàn)驗(yàn)證;
2、機(jī)器學(xué)習(xí)算法的運(yùn)用;
3、多層面免疫浸潤(rùn)分析;
4、預(yù)后模型與免疫微環(huán)境的關(guān)聯(lián)分析。
更多伯豪生物人工服務(wù):