2 月 11 日,世界衛(wèi)生組織(WHO)正式將新冠肺炎病命名為 COVID-19,國際病毒分類委員會(ICTV)將新冠病毒命名為 SARS-CoV-2。SARS-CoV 病毒引起 SARS 病,SARS-CoV- 2 病毒引起 COVID-19 病,從官名上能看出新冠病毒與非典病毒有著密切聯(lián)系,科研人員也揭示了不同病毒間蛋白質(zhì)(氨基酸序列)的差異可能是新冠病毒比 SARS 和 MERS 更具傳染性的原因。除了蛋白方面的差異,病毒基因組也必然存在著差異。從 2003 年的 SARS 到 2012 的 MERS,再到 2020 的 COVID-19,毫無疑問,我們?nèi)庋劭床坏降墓跔畈《疽苍诎l(fā)生著變異與進化,這些變異有利于病毒自身,卻危害人類生命健康。今天小編要分享的便由變異所起——拷貝數(shù)變異的相關(guān)信息,提供拷貝數(shù)變異檢測方面的參考。
拷貝數(shù)變異的形成和致病機制
拷貝數(shù)變異屬于結(jié)構(gòu)變異的一種,可分為拷貝數(shù)增加和拷貝數(shù)減少??截悢?shù)變異是人類遺傳多樣性的來源之一。而且通過重組、復制或其他方式產(chǎn)生的拷貝數(shù)變異似乎比單核苷酸多態(tài)性要高得多。但拷貝數(shù)變異并不一定會導致疾病,可能僅僅是作為一種多態(tài)性而存在,這與大量的單核苷酸多態(tài)性一樣,是良性的。異常的拷貝數(shù)變異通常是癌癥、遺傳病甚至是某些復雜疾病的重要分子機制。
拷貝數(shù)變異的產(chǎn)生主要涉及 4 種機制:
非同源重組、非同源連接、L1 反轉(zhuǎn)錄以及復制叉滯后連接等。
拷貝數(shù)變異對表型的影響機制主要有:
1)基因劑量;
2)功能失活;
3)基因融合;
4)位置效應;
5)橫向效應等。
拷貝數(shù)變異與三體綜合征
人類很早就認識到拷貝數(shù)變異與疾病之間的關(guān)系,但受到檢測精度的限制,早期的發(fā)現(xiàn)以大的染色體水平的變異為主。隨著基因芯片、高通量測序等多種檢測技術(shù)的快速發(fā)展,越來越多的拷貝數(shù)變異被檢測出來,包括亞顯微結(jié)構(gòu)的拷貝數(shù)變異檢測成為可能。
三體綜合征是典型的基因組拷貝數(shù)變異引起的疾病,例如 21 三體綜合征、18 三體綜合征和 13 三體綜合征。21 三體綜合征又名唐氏綜合征,發(fā)病率約為 1 /700。13 三體綜合征于 1657 年被 Thomas Bartholin 初次記載,并由 Klaus Patau 在 1960 年報道染色體核型,也稱為 Patau 綜合征。18 三體綜合征于 1960 年被 John Hilton Edwards 報道,也被稱為 Edwards 綜合征。
拷貝數(shù)變異數(shù)據(jù)庫
拷貝數(shù)變異數(shù)據(jù)收錄于 DGV 數(shù)據(jù)庫(http://dgv.tcag.ca/dgv/app/home),記錄了一系列基因變異與表型相關(guān)的信息,數(shù)據(jù)庫信息持續(xù)更新,截至 2020.2.19,DGV 數(shù)據(jù)庫收錄了總共 72 項研究 6359956 個樣本的 CNV 信息,大多數(shù)的 CNV 分布在 1 -10Kb,其次為 100-500bp。

圖 1 DGV 數(shù)據(jù)庫變異數(shù)目逐年增加情況

圖 2 DGV 數(shù)據(jù)庫 CNV 大小的分布情況

圖 3 DGV 數(shù)據(jù)庫項目數(shù)情況
拷貝數(shù)變異檢測平臺的技術(shù)比較
傳統(tǒng)的染色體核型分析、全基因組范圍內(nèi) CNV 芯片、高通量測序技術(shù)均可以對 CNV 進行檢測,接下來的兩篇文獻均是關(guān)于芯片和測序兩大 CNV 檢測平臺的比較研究,孰優(yōu)孰劣讓我們一探究竟。
文獻 1 是 2016 年香港中文大學醫(yī)學院團隊發(fā)表于國際醫(yī)學遺傳學權(quán)威學術(shù)雜志 Genetics in Medicine 的文章討論了 NGS 技術(shù)是否可以作為常規(guī)臨床應用中 CNV 檢測的替代方法。
該團隊使用低覆蓋度的全基因組測序流程,對 570 名患者的多中心組進行了全基因組 CNV 分析(> 50 kb)和芯片檢測分析。根據(jù)美國醫(yī)學遺傳學和基因組學指南對 CNV(即致病性 CNV,pCNV)進行了分類。結(jié)果發(fā)現(xiàn),CMA 和基于 NGS 的方法在 71 個驗證樣本中的 pCNV 的結(jié)果一致(如下圖表)。
研究者也指出,高深度全基因組測序(whole genome sequencing,WGS)可以提供整個基因組的全面視圖,是一種高通量的檢測單核苷酸變異、插入 / 缺失、拷貝數(shù)變異和基因組結(jié)構(gòu)重組的技術(shù)手段。但目前而言,高深度 WGS 的價格高昂,且變異信息較多,較難在產(chǎn)前診斷中廣泛應用;而基于低深度 WGS 的水平,能夠在降低每個樣本的測序成本基礎(chǔ)上,同時提高檢測通量,達到低深度高通量的目的(low-pass WGS)。
文獻 2 也是來自于同一團隊,2019 年 12 月份發(fā)表于 Genetics in Medicine,增加了樣本例數(shù),對低深度高通量全基因組測序和染色體微陣列分析進行了深入比較,分析結(jié)果支持了將低深度全基因組測序用于產(chǎn)前診斷中以提供更多有意義的臨床信息。
研究人員將 2016-2019 年入組的 1023 名孕婦同時進行了 CMA 和 NGS 檢測。CMA 檢測出共 121 例樣本的異常,包括 87 個非整倍性和 37 個致病或可能致病的 CNV,這兩種染色體異常存在部分重疊;而低深度測序不僅檢測到了全部的 CMA 檢出的染色體異常,還額外檢測到 17 例非整倍性或致病 / 可能致病的染色體拷貝數(shù)變異。作者進一步分析了測序分析結(jié)果的靈敏度和特異性,以芯片分析為基準,低深度全基因組測序達到了 99.9%(121/121)的靈敏度和 87.7%(121/138)的特異性,總體診斷陽性率為 13.5%(138/1023)。在 DNA 起始量方面,芯片起始量 300ng DNA 和低深度測序起始量 50ng 為標準進行了樣本制備,結(jié)果是低深度全基因組測序樣本中有 5 例未能通過初期試驗,而芯片則有 47 例未通過,也就是造成了重復實驗率分別為 0.5%(5/1023)和 4.6%(47/1023),這些結(jié)果綜合說明低深度全基因組測序應用于產(chǎn)前診斷的樣本要求更低,實驗也更加穩(wěn)定。
從 CNV 檢測技術(shù)總體來看,傳統(tǒng)的染色體核型分析一直被認為是確診染色體變異的標準,也是染色體病產(chǎn)前診斷的一線方法,但是檢測周期長、分辨率較低,無法檢出 5Mb 以下的 CNV。目前主要用于全基因組范圍內(nèi) CNV 檢測的“金標準”技術(shù)為 CNV 芯片,檢測范圍廣、分辨率較高;缺點是成本較高,在大規(guī)模的產(chǎn)前診斷應用中有所限制。而近年來發(fā)展起來的高通量測序技術(shù),為 CNV 檢測提供了新的手段,具有成本低、通量高、檢測便捷等優(yōu)勢。

不可否認,芯片方法依然是拷貝數(shù)檢測的金標準,基于高通量測序平臺檢測 CNV 的多篇文獻中也提到了這一點,并以此為基準分析測序方法的準確度和靈敏度。高通量的方法作為后起之秀,檢測結(jié)果依賴于測序質(zhì)量、測序數(shù)據(jù)量、分析軟件等,完全替代芯片還需些時間。伯豪生物提供芯片和高通量測量測序兩種平臺的檢測服務,小編建議各位老師們可以按需選擇。
這次疫情已導致 7 萬余人受到新冠病毒的感染,同時得到了國內(nèi)外千千萬萬人的高度關(guān)注,我們有理由相信,人類終將贏得這場戰(zhàn)“疫”,而勝利之后的人類該會敬畏自然,善待自然界的其他動物們!