染色體重排導(dǎo)致的基因融合事件廣泛存在于多種腫瘤當(dāng)中。例如在人類基因組研究中發(fā)現(xiàn),異常的融合基因可引起惡性血液疾病以及腫瘤,包括 EMLA-ALK 和 BCR-ABL1 融合基因?qū)е掳籽?,TMPRSS2-ERG(前列腺癌),EML4-ALK( 肺癌),VTI1A-TCF7L2( 直腸癌)[1]。由于基因融合產(chǎn)物是腫瘤中常見驅(qū)動因素,因此可作為抗癌治療中潛在的預(yù)后和治療靶標(biāo)。小編之前著重介紹和比較了當(dāng)下檢測融合基因的相關(guān)技術(shù),由于新一代測序(NGS) 技術(shù)的不斷發(fā)展和廣泛應(yīng)用,利用生物信息學(xué)方法來檢測融合突變也取得了較大的進展,因此本專題主要介紹 NGS 技術(shù)包括 RNA 和 DNA 兩個層面及其相關(guān)的生信方法。
新一代測序檢測融合基因主要有全基因組測序(WGS)、轉(zhuǎn)錄組測序(RNA-seq) 和目標(biāo)區(qū)域靶向(根據(jù)靶向富集方法不同又分為雜交捕獲和擴增子測序)等技術(shù)。一般而言,WGS 應(yīng)該在合理的測序深度下進行融合基因檢測,一般要求~30-60X,這對于腫瘤標(biāo)本的低克隆性融合尤為重要。與之相反,RNA-seq 由于只能檢測轉(zhuǎn)錄和剪接成熟 mRNA 的基因組區(qū)域,因此只能檢測到相對高表達的融合。此外,根據(jù)已知的融合位點,設(shè)計特定的檢測探針,采用靶向捕獲 DNA 或 RNA panel 測序獲得遠高于 WGS 的測序深度,從而可以更敏感的檢測出融合基因,因此該技術(shù)在臨檢領(lǐng)域更為適用。測序讀長取決于 NGS 的平臺,在檢測融合基因時推薦較長的讀長,從而盡可能捕獲到斷裂點 [2]。
檢測技術(shù) | 檢測層面 | 主要實驗過程 |
全基因組重測序(WGS) | DNA | 基因組 DNA 隨機片段化,加接頭,測序 |
目標(biāo)區(qū)域雜交捕獲測序 | DNA/RNA | 文庫制備,加接頭,特異性 DNA/RNA 序列富集,擴增后測序 |
轉(zhuǎn)錄組測序(RNA-seq) | RNA | mRNA 反轉(zhuǎn)錄 cDNA 并制備文庫 |
目標(biāo)區(qū)域擴增子測序 | RNA | 在融合點處擴增測序 |
核酸質(zhì)譜 (MassArray) | RNA | 反轉(zhuǎn)錄,PCR,引物延展,基質(zhì)輔助激光解吸 / 電離 |
數(shù)字化基因定量(NanoString) | RNA | 序列特異性雜交 |
融合基因檢測常用基因組方法 [2]
RNA 測序技術(shù)能夠很好地識別物種中產(chǎn)生異常變異的 RNA 種類,使發(fā)現(xiàn)因功能性或互作關(guān)系引起的基因融合及其導(dǎo)致的病變研究成為可能。雙端配對的 RNA 測序能夠提高基因的覆蓋率,因此對檢測基因融合具有特別的優(yōu)勢,該方法已被用于病理學(xué)的研究,并為調(diào)控與治療提供潛在的可能性。目前已經(jīng)有很多生物學(xué)工具基于高通量測序數(shù)據(jù)來檢測融合基因,如 FusionSeq、deFuse、TopHat-Fusion、Fusion-Hunter、STAR-Fusion 等。
RNA 測序檢測融合基因主要有兩種分析策略:
1、基于序列比對的方法,尋找不一致序列(discordant pair reads) 和覆蓋斷裂點的序列(junction/split reads) 從而識別出融合事件。
2、基于拼接比對的方法,首先組裝出新的轉(zhuǎn)錄本,然后比對到基因組,從而鑒定出與染色體重排一致的融合轉(zhuǎn)錄本 [3]。
RNA-seq 檢測融合基因的兩種分析策略 [3]
目前針對 RNA-seq 已經(jīng)開發(fā)出很多檢測融合基因的生信工具,大多都是基于以上兩種分析策略進行預(yù)測的。對于融合基因檢測,RNA-seq 是一種非常高效的方法,可以在較低成本下對全基因組范圍內(nèi)的融合基因進行檢測,其分辨率和通量比傳統(tǒng)方法要高很多,并且還能發(fā)現(xiàn)新的融合基因。
RNA-seq 檢測融合基因工具匯總 [3]
分析工具測評結(jié)果顯示,大多數(shù)情況下,STAR-Fusion 在所有檢測工具中的排名高,其次是 Arriba 和 STAR-SEQR,見下圖。在組裝比對策略中,TrinityFusion- C 工具排名高。值得注意的是,排名前三的工具都是采用 STAR 工具進行比對的。
RNA-seq 分析融合基因工具準(zhǔn)確性評估 [3]
DNA 測序也可以對融合基因進行檢測,由于融合基因大多發(fā)生在內(nèi)含子區(qū)域,采用 WGS 對整個基因組進行測序的方法往往成本較高,目前對于已知融合位點的檢測,推薦目標(biāo)區(qū)域靶向(panel) 測序。融合基因作為結(jié)構(gòu)變異(SV) 的一種類型,采用 DNA 測序分析融合基因的策略主要包括:
1、雙端序列配對法(pair-end method)
該方法總體思路是將雙端序列比對到基因組上,然后評估雙端配對序列的距離和方向是否和建庫信息一致。
2、斷裂序列法(split-read approach)
獲得比對到基因組上的單端序列,將未能比對上的那部分序列切斷,然后重新進行比對,獲得比對位置和比對方向。
目前針對 DNA 測序開發(fā)出許多檢測結(jié)構(gòu)變異(SV) 的生信工具,見下圖,也有專門檢測融合基因的工具,比如 BreakID 和 GeneFuse 等工具。檢測融合基因的工具大多基于以上兩種分析策略進行預(yù)測的。不同的預(yù)測工具采用的策略有所不同,可以結(jié)合不同的檢測工具來獲得更好的靈敏度。當(dāng)然,這種綜合的方法并非是結(jié)果簡單整合,而是優(yōu)先考慮更準(zhǔn)確的策略,例如斷裂序列法要優(yōu)先于雙端序列配對法 [5]。
總的來說,過去的十幾年里,新一代測序技術(shù)在融合基因檢測方面發(fā)揮著越來越重要的作用,有著其他技術(shù)無法比擬的優(yōu)勢。隨著測序技術(shù)的不斷發(fā)展,產(chǎn)生的讀長更長,也為融合基因的檢測帶來了新的機遇和挑戰(zhàn)。
參考文獻:
[1] Qingguo Wang, Junfeng Xia, Peilin Jia, et al. Application of next generation sequencing to human gene fusion detection: computational tools, features and perspectives. Brief Bioinform, 2013, 14(4): 506-519.
[2] Jan Schr?der , Amit Kumar , Stephen Q Wong. Overview of Fusion Detection Strategies Using Next-Generation Sequencing. Methods Mol Biol, 2019:125-138.
[3] Brian J , Alexander Dobin, Bo Li, et al. Accuracy assessment of fusion transcript detection via read-mapping and de novo fusion transcript assembly-based methods. Genome Biol, 2019, 20(1): 213.
[4] Haley J and Eric Duncavage. Detection of structural DNA variation from next generation sequencing data: a review of informatic approaches. Cancer Genet. 2013, 206(12): 432-440.
[5] Peiyong Guan, Wing-Kin Sung. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review. Methods, 2016,102:36-49.
更多伯豪生物人工服務(wù):