2020 年 1 月,整個(gè)中國(guó)因新型冠狀病毒 2019-nCov 得了一場(chǎng)“感冒”。疫情一開(kāi)始,武漢病毒研究所石正麗團(tuán)隊(duì)就用實(shí)驗(yàn)證實(shí)了血管緊張素轉(zhuǎn)化酶 2(Angiotensin-converting enzyme 2,ACE2)是新型冠狀病毒感染人體的受體基因。2020 年 1 月 26 日,上海同濟(jì)大學(xué)醫(yī)學(xué)院左為研究團(tuán)隊(duì)在《bioRxiv》上發(fā)表了題為“Single-cell RNA expression profiling of ACE2, the putative receptor of Wuhan 2019-nCov”的文章。
該研究利用已有的數(shù)據(jù)庫(kù),結(jié)合單細(xì)胞 RNA 測(cè)序技術(shù)中相關(guān)生信分析,對(duì) ACE2 在人肺內(nèi)單個(gè)細(xì)胞的表達(dá)情況進(jìn)行了分析,共涉及 8 個(gè)樣本,43134 個(gè)細(xì)胞。結(jié)果表明:ACE2 受體主要在一部分(1% 左右)II 型肺泡上皮細(xì)胞(AT2) 中表達(dá);同時(shí)發(fā)現(xiàn)這些 AT2 細(xì)胞除了表達(dá)病毒受體,還表達(dá)與病毒復(fù)制和傳播相關(guān)的基因,說(shuō)明其很可能是冠狀病毒的靶細(xì)胞??梢?jiàn),單細(xì)胞測(cè)序技術(shù)不僅是科研的利器,同時(shí)還為破解疫情做了應(yīng)有的貢獻(xiàn)。那么,1 月份利用單細(xì)胞測(cè)序技術(shù)在基礎(chǔ)研究中還有哪些突破呢?
圖 1 人肺的單細(xì)胞分析
1 月份搜集到高分文獻(xiàn)(IF>10)26 篇,表 1 按照在線時(shí)間順序列出了文章所在期刊、研究方向,分選平臺(tái)以及英文題目等。
表 1 2020 年 1 月單細(xì)胞測(cè)序高分文獻(xiàn)集錦
我們知道 2011 年,《Nature Methods》將單細(xì)胞測(cè)序列為當(dāng)年度值得期待的技術(shù)之一;2013 年 1 月,《Science》雜志將單細(xì)胞測(cè)序列為年度值得關(guān)注的六大領(lǐng)域榜首;2014 年 1 月,《Nature Methods》將單細(xì)胞測(cè)序列為 2013 年度重要的方法學(xué)進(jìn)展。讓人興奮的是 2020 年 1 月 6 號(hào)《Nature Methods》將單細(xì)胞多組學(xué)分析選為了“Method of the Year 2019”,并在線發(fā)表 5 篇相關(guān)文章(表 1 中標(biāo)黃部分)。
其中,加利福尼亞大學(xué)圣地亞哥分校任兵教授在文章“Single-cell multimodal omics: the power of many”中分享了單細(xì)胞多組學(xué)的實(shí)驗(yàn)設(shè)計(jì)。文章首先總結(jié)現(xiàn)有的單細(xì)胞多組學(xué)測(cè)序技術(shù)的應(yīng)用范圍,包括細(xì)胞核內(nèi) DNA,RNA,DNA 甲基化,染色體開(kāi)發(fā)程度,染色體三維結(jié)構(gòu),胞質(zhì) RNA,線粒體基因組,細(xì)胞表面蛋白質(zhì)以及基于 CRISPR 的測(cè)序技術(shù)。
圖 2 已開(kāi)發(fā)的同時(shí)分析單細(xì)胞表觀遺傳特征、DNA 序列、基因表達(dá)變異和細(xì)胞表面蛋白的方法。藍(lán)色代表低通量高成本的測(cè)序技術(shù),棕色代表高通量低成本的測(cè)序技術(shù)。
然后作者總結(jié)現(xiàn)有技術(shù)的不足和發(fā)展的方向,比如單細(xì)胞基因檢測(cè)數(shù)較少(可通過(guò)實(shí)驗(yàn)設(shè)計(jì)改善);單細(xì)胞蛋白組學(xué)不成熟(提高靈敏度和通量);空間測(cè)序技術(shù)只用于轉(zhuǎn)錄組(應(yīng)擴(kuò)展到其他組學(xué))。
圖 3 現(xiàn)有單細(xì)胞多組學(xué)技術(shù)的不足和發(fā)展方向
同時(shí)在線的另外一篇文章“Computational methods for single-cell omics across modalities”則講述了單細(xì)胞多組學(xué)聯(lián)合分析方法。分析對(duì)象:整合不同數(shù)據(jù)對(duì)象(ATAC,RNA,蛋白)的同時(shí),保留細(xì)胞類型固有生物學(xué)差異。實(shí)際問(wèn)題:批次效應(yīng)處理,ATAC/RNA 整合,CITE-seq 數(shù)據(jù)分析等?;痉椒ǎ篊CA/ 非負(fù)矩陣分解 / 自編碼等?;驹恚憾嘟M學(xué)整合的思路與批次效應(yīng)去除的思路相似,combat 是基于線性回歸的批次效應(yīng)去除方法,CCA 是 Seurat 剛開(kāi)始處理批次效應(yīng)的基本方法,后來(lái)用于 ATAC/RNA 整合的方法 anchor 也是基于 CCA,ATAC/RNA 整合的方法也可以用非負(fù)矩陣分解。未來(lái)可期:RNA 和 ATAC 組合可以促進(jìn)調(diào)控網(wǎng)絡(luò)研究;空間數(shù)據(jù)可以輔助細(xì)胞間相互作用的分析;整合 Bulk 數(shù)據(jù)和單細(xì)胞數(shù)據(jù)。
圖 4 單細(xì)胞多組學(xué)聯(lián)合分析不同計(jì)算方法的示意圖
1 月份單細(xì)胞測(cè)序另一個(gè)突破就是和空間轉(zhuǎn)錄組實(shí)現(xiàn)強(qiáng)強(qiáng)聯(lián)合,以獲得目標(biāo)組織的三維空間轉(zhuǎn)錄組圖譜。2020 年 1 月 13 日,《Nature Biotechnology》上發(fā)表了“Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas”的文章。作者對(duì) 3 個(gè)胰腺導(dǎo)管癌(PDAC)組織 A、B、C 進(jìn)行 scRNA-seq(indrop-seq),同時(shí)對(duì) 2 個(gè)主要樣本(A、B,各 3 張切片),4 個(gè)附加樣本(D、E、F 和 G,各 1 張切片),共 10 張切片做空間轉(zhuǎn)錄組(ST)。樣品 A 和 B 的 scRNA-seq 和 ST 的數(shù)據(jù)集信息通過(guò)多模式相交分析(Multimodal intersection analysis,MIA)進(jìn)行整合,就是用超幾何算法檢驗(yàn)細(xì)胞亞群的 marker 基因與組織亞區(qū)的 marker 基因重疊的數(shù)目是否達(dá)到顯著水平,若顯著,則認(rèn)為該細(xì)胞亞群與該組織亞區(qū)相對(duì)應(yīng)。
作者確定了組織中亞區(qū)中特定的細(xì)胞類型后,通過(guò)進(jìn)一步細(xì)分細(xì)胞亞群和組織亞區(qū),再次利用 MIA 算法進(jìn)行映射,獲得了更為詳細(xì)的細(xì)胞位置 - 類型信息。作者利用得到的 MIA 結(jié)果繪制了不同腫瘤樣本微環(huán)境的特點(diǎn),免疫環(huán)境狀態(tài),應(yīng)激水平以及細(xì)胞之間相互作用的模式,有助于預(yù)判患者預(yù)后??梢?jiàn),MIA 算法的開(kāi)發(fā)可將高分辨率的 scRNA-seq(單細(xì)胞水平)和帶空間位置信息的 ST 結(jié)合,為全面解析組織生物學(xué)信息提供了技術(shù)支撐。
圖 5 實(shí)驗(yàn)設(shè)計(jì)與分析示意圖。手術(shù)切除的 PDAC 腫瘤同時(shí)進(jìn)行 scRNA-seq 和 ST 處理。聚類后,根據(jù)特異表達(dá)的基因推斷每個(gè)簇的細(xì)胞類型。剩余組織的冷凍切片用于 ST 分析,其中每個(gè)點(diǎn)捕獲組織中特定位置細(xì)胞中的轉(zhuǎn)錄組。將多模式相交分析(MIA)應(yīng)用于兩個(gè)數(shù)據(jù)集,揭示了各種細(xì)胞類型的空間分布。