/s/7 bqcpr 1 bmjazhv 408-sv6Q
染色質免疫沈澱測序(ChIP-seq)是壹種針對DNA結合蛋白、組蛋白修飾或核小體的全基因組分析技術。隨著測序成本的降低,ChIP-seq已經成為研究基因調控和表觀遺傳機制不可或缺的工具。在本文中,我們對前面的內容進行了總結,分析了ChIP-seq現階段需要註意的問題以及如何更好地利用這壹技術來獲得研究成果。
盡管甲醛是壹種高滲透性的交聯劑,但其交聯效率低,因為其反應性僅限於胺。對於哺乳動物細胞,最大交聯效率僅為1%。在DNA上停留時間小於5秒的蛋白質不能被蛋白質交聯。此外,甲醛還會導致很多其他不相關的蛋白質交聯到DNA上,影響後續的分析數據。有報道稱,甲醛交聯會引發DNA損傷反應機制,從而改變染色質組成,進而使芯片結果出現偏差。因為在加熱和低PH下交聯反應會發生逆轉,所以DNA與蛋白質交聯復合物的穩定性也是壹個值得關註的問題。
根據有無甲醛交聯步驟,切片可分為兩種類型。壹類是甲醛交聯的X-ChIP(交聯和機械剪切切片)。另壹種是沒有交聯的芯片,即N芯片(native-ChIP);與X芯片相比,N芯片有很多優點:(1)分辨率高;(2)避免了甲醛交聯引起的非特異性蛋白質在DNA上的富集;(3)避免甲醛交聯以抵抗抗原表位的覆蓋;(4)減少了樣本損失。因為用了mnase,N-chip只適合研究組蛋白修飾,不適合研究轉錄因子。
常用的裂解酶是MNase,即微球菌核酸酶,能降解核小體連接區DNA序列的核酸酶;染色質的MNase消化可以釋放獨立的核小體。MNase酶解有壹定的局限性:(1)傾向於切割A/T堿基位點,使得核小體A/T富集區的表達低於真實情況;(2)MNase不能在核小體邊界準確切割,導致染色體開放位置與真實情況有差異;(3)MNase傾向於消化脆性核小體;(4)4)MNase得到的DNA片段相對較短,給後續樣品的PCR擴增和檢測帶來困難。
有研究認為,超聲波中斷不如酶切溫和,不均勻的中斷會導致測序結果的背景噪音較高,影響後續的數據分析。當選擇中斷模式時,(1)如果所研究的蛋白質是高表達的,並且與DNA結合緊密,比如組蛋白,那麽樣品不需要交聯,可以使用酶解;(2)如果所研究的蛋白質表達豐度較低或與DNA結合不緊密,如轉錄因子,最好用交聯劑固定樣品,以穩定蛋白質和DNA形態。在這種情況下,超聲波破碎是最好的。
ChIP-seq數據可用於分析不同的細胞類型,這些細胞類型的信息可用於推斷基因組動態信息或用壹些實驗數據註釋細胞類型的表觀遺傳圖譜。越來越多的研究表明,表觀遺傳信息與基因表達和染色體構象高度相關,可以用來預測基因表達和染色體構象。在這壹節中,我們簡要介紹了組蛋白修飾芯片序列分析的先進應用工具。
已經開發了基於機器學習的各種方法,以通過從ChIP-seq實驗獲得的表觀遺傳信息來定量推斷基因表達水平。例如,將(1)線性回歸模型應用於組蛋白修飾和啟動子位點的富集,以預測CD4+T細胞中的基因表達;他們使用了19組蛋白修飾,這表明只需要三個啟動子位點的修飾就足以模擬基因表達[1]。(2)使用非線性模型(如多元自適應回歸線(MARS)和隨機森林),繪制了7種人類細胞系中的11個組蛋白修飾和DNase I超敏反應圖[2]。這些模型只考慮了啟動子位點的表觀遺傳模式,而沒有考慮增強子位點的信息。相反,DeepExpression[3]使用HiChIP data [4],壹種高通數量技術來捕獲蛋白質的中央染色體環,以考慮增強子及其與啟動子的相互作用。還有壹些工具使用卷積神經網絡(CNN)來預測基因表達[5]或差異基因調控模式[6]。
大量研究表明,增強子上的單堿基多態性會導致遺傳病和癌癥[7],因此需要壹種方法來定義增強子在不同細胞系上的狀態。染色質構思捕獲(3C)實驗擴展了壹些新技術:Hi-C[8]、HiChIP[4]和ChIA-PET[9],可以捕獲增強子和靶基因之間的空間結構。Hariprakash和Ferrari將探索基因與增強子相互作用的方法分為四類:(1)基於相關性估計所有增強子-啟動子對的相互作用強度;(2)基於回歸的方法假設多個增強子對單個基因有貢獻;(3)基於監督學習和評分的方法可以整合多個ChIP-seq數據集和其他信息類型。這些工具側重於增強子-啟動子相互作用,但還有許多其他類型的染色質相互作用,如增強子-增強子環和相分離產生的弱染色質聚集[10]。CITD[11]和龍[12]分別利用小波變換和勢能函數從表觀遺傳數據中綜合分析三維基因組組織。
ChIP-seq數據中的偏差和批次效應對分析有很大影響。因為機器學習方法對訓練數據中的噪聲敏感,所以壹些ChIP-seq樣本將被識別為中等質量或被拒絕為低質量數據(導致數據丟失)。如果生物樣本比較珍貴(如原代細胞和臨床樣本),難以大量采集樣本,則可能適用“數據插值”方法。這些方法使用來自其他密切相關細胞類型的表觀遺傳數據進行數據去噪或重建。“數據去噪”旨在通過識別和消除數據中的噪聲來提高現有ChIP-seq樣本的質量。軟件Coda[13]可以對產生噪聲的過程進行編碼,利用卷積神經網絡對ChIP-seq數據中的信號進行恢復。“數據重建”的目的是從計算機中的大數據集生成缺失的芯片序列數據。Chromimpulse [14]是壹個新工具,它可以使用回歸樹來推斷使用十種最相關細胞類型的每個刪除實驗的信號。軟件PREDICTD[15]和Avocado[16]使用張量分解來同時插入多個ChIP-seq數據。這些數據插值方法是實際ChIP-seq實驗的潛在計算替代方法,並可能為收集生物學上不可能的所有細胞類型和環境條件的表觀基因組數據開辟道路。雖然這種方法在計算上具有挑戰性,但來自各種細胞類型的人可以使用高質量的數據來鼓勵他們實現這壹目標。
最近的研究表明,許多細胞類型(包括正常的免疫細胞)在復雜的組織和腫瘤中發揮著重要的輔助功能。為了闡明這種細胞異質性和細胞在發育過程中的命運軌跡,人們發展了各種單細胞測定方法。其中,scChIP-seq可以從低輸入樣本中以單細胞分辨率分析組蛋白修飾和其他染色質結合蛋白的全基因組。最近,用於單細胞標記和芯片序列文庫制備的許多方法已經用於單細胞標記和芯片序列文庫制備;這些方法使用微流體系統、Tn5轉座酶標記和無芯片策略。
第壹種scChIP-seq方法,scDrop-ChIP [17]使用微流控系統標記細胞,結合標準芯片方法,在每個細胞中產生約800個非重復閱讀片段。最近開發的微滴微流控方法[18]提供了更高的分辨率,每個細胞產生約10000個不重復的閱讀片段。這些方法的局限性在於,大多數實驗室通常無法使用特殊的微流體裝置。
使用Tn5轉座酶的基於標簽的文庫制備已廣泛用於各種NGS分析,包括ChIP-seq。Sc-itChIP-seq [19]在經典的芯片實驗之前,利用標記技術對單細胞進行標記,制備文庫。這種方法每單位產生9000個不重復的閱讀片段。因為實驗過程類似於標準的ChIP-seq方法,所以這種方法比scDrop-ChIP更容易使用。
ScChIP-seq開發了幾種無芯片方法:單細胞染色質免疫裂解測序(scChIC-seq)[20]和單細胞uli cut & RUN[21];+0];它們基於CUT&RUN方法[22],MNase和蛋白A的融合蛋白用於檢測具有特異性抗體的切割靶位點。這些方法每個細胞產生約4100個非重復閱讀片段,然後需要嚴格的實驗步驟來制備文庫。缺點是讀取的比率相對較低(~ 6%)。此外,還開發了三種類似的方法:CUT&Tag [23]]、ACT-seq [24]和CoBATCH [25],它們使用Tn5轉座酶和蛋白A作為融合蛋白。在文庫制備過程中,目的蛋白與染色體結合後,融合蛋白捕獲壹抗,然後激活Tn5轉座酶標記蛋白結合位點。這些方法的優點是蛋白質結合位點檢測和文庫制備可以同時進行,從而大大減少了實驗步驟和時間。此外,這些方法較少受到由免疫沈澱步驟引起的誤差的影響。此外,這些方法顯示出約97%的比較率,每個細胞產生約12000個非重復閱讀片段。因此,這種無芯片方法具有高通和高質量scChIP-seq分析的潛力。最後,染色質整合標記和測序(ChIL-seq)[26]是另壹種無芯片方法,它基於免疫染色而不是芯片。該方法使用與dsDNA偶聯的第二抗體探針,其包含T7 RNA聚合酶啟動子、NGS接頭序列和Tn5結合序列。捕獲第壹抗體後,通過Tn5轉座酶將探針DNA序列整合到靶結合位點。然後通過轉錄擴增整合區域,並進行RNA純化和文庫制備。該方法可用於單細胞分析,但可能需要多次優化才能實現高通量測序。其他scChIP-seq方法將在未來發展,如同時檢測多個組蛋白修飾和其他染色質結合蛋白。這些研究將能夠捕獲每個細胞染色體上的基因調控因子,並知道它們之間的相互作用。
[1]R. Karlic,H.R. Chung,J. Lasserre,K. Vlahovicek,M. Vingron,組蛋白修飾水平可預測基因表達,美國國家科學院院刊U SA 107(7)(2010)2926-31。
[2]X. Dong,M.C. Greven,A. Kundaje,S. Djebali,J.B. Brown,C. Cheng,T.R.Gingeras,M. Gerstein,R. Guigo,E. Birney,Z. Weng,在各種細胞環境中使用染色質特征模擬基因表達,Genome Biol 13(9)(2012)R53 .
[3]W. Zeng,Y. Wang,R. Jiang,通過密集連接的卷積神經網絡整合遠端和近端信息預測基因表達,生物信息學36(2) (2020) 496-503。
[4]M.R. Mumbach,A.J. Rubin,R.A. Flynn,C. Dai,P.A. Khavari,W.J. Greenleaf,H.Y. Chang,HiChIP:蛋白質導向的基因表達譜的有效和靈敏分析,Nat方法13(11)(2016)919-922。
[5]R. Singh,J. Lanchantin,G. Robins,Y. Qi,DeepChrome:從組蛋白修飾預測基因表達的深度學習,生物信息學32(17)(2016)i639-i648。
[6]A. Sekhon,R. Singh,Y. Qi,DeepDiff:從組蛋白修飾預測差異基因表達的深度學習,生物信息學34(17)(2018)I 891-i900。
[7]H. Chen,C. Li,X. Peng,Z. Zhou,J.N. Weinstein,n .癌癥基因組圖譜研究,H. Liang,對近9000個患者樣品中增強子表達的泛癌分析,細胞173(2)(2018)386-399 e 12。
[8]E. Lieberman-Aiden,N.L. van Berkum,l.《揭示人類基因組折疊原理的長程相互作用綜合圖譜》,《科學》326(5950)(2009) 289-93。
[9]M.J. Fullwood,M.H. Liu,Y.F. E.T. Liu,C.L. Wei,E. Cheung,Y.Ruan,壹種雌激素受體-α-結合的人類染色質相互作用組,Nature462(7269)(2009) 58-64 .
[10]B.R .薩巴裏、a .達爾·阿涅塞、a .博伊賈、I.A .克萊因、E.L .科菲、k .施裏尼瓦斯、B.J .亞伯拉罕、N.M .漢內特、A.V .薩穆迪奧、J.C .曼泰加、C.H .李、Y.E .郭、D.S .戴、j .舒傑斯、e .瓦西裏、s .馬利克、D. Hnisz、T.I .李、西斯
[11]陳,王,宣,陳,張,通過表觀遺傳圖譜的小波變換重新解讀三維染色質相互作用和拓撲域,核酸研究44(11)(2016)e 106。
[12]齊,張,用染色質狀態預測三維基因組結構,PLoS computo Biol 15(6)(2019)e 1007024。
[13]P.W. Koh,E. Pierson,A. Kundaje,去噪全基因組組蛋白芯片-序列與轉換神經網絡,生物信息學33(14)(2017)i225-i233。
[14]J. Ernst,M. Kellis,《用於不同人體組織系統註釋的表觀基因組數據集的大規模插補》,《自然生物技術》33(4) (2015)364-76。
[15]T.J. Durham,M.W. Libbrecht,J.J. Howbert,J. Bilmes,W.S. Noble,使用基於雲的張量分解進行預測平行表觀基因組學數據插補,natcommun 9(1)(2018)1402。
[16]J. Schreiber,T. Durham,J. Bilmes,W.S. Noble,多尺度深度張量分解學習人類表觀基因組的潛在表示,bioRxiv(2019)。
[17]A. Rotem,O. Ram,N. Shoresh,R.A. Sperling,A. Goren,D.A. Weitz,B.E.Bernstein,單細胞芯片-seq揭示由染色質狀態定義的細胞亞群,Nat bio technol 33(11)(2015)1165-72。
[18]K. Grosselin,A. Durand,J. Marsolier,A. Poitou,E. Marangoni,F. Nemati,A.Dahmani,S. Lameiras,F. Reyal,O. Frenoy,Y. Pousse,M. Reichen,A. Woolfe,C.Brenan,A.D. Griffiths,C. Vallot,A. Gerard,高通量單細胞芯片-seq鑒定乳腺癌染色質狀態的異質性,NatGenet 560
[19]S. Ai,H. Xiong,C.C. Li,Y. Luo,Q. Shi,Y. Liu,X. Yu,C. Li,A. He,使用單細胞itChIP-seq分析染色質狀態,Nat Cell Biol 21(9)(2019)1164-1172。
[20]W.L .,K. Nakamura,W. Gao,K. Cui,G. Hu,Q. Tang,B. Ni,K. Zhao,單細胞染色質免疫切割測序(scChIC-seq)以描繪組蛋白修飾,Nat方法16(4) (2019) 323-325。
[21]S.J. Hainer,A. Boskovic,K.N. McCannell,O.J. Rando,T.G. Fazzio,單細胞和早期胚胎中生殖因子的分析,Cell 177(5)(2019)1319-1329 e 11。
[22]P.J. Skene,S. Henikoff,用於DNA結合位點的高分辨率作圖的高效靶向核酸酶策略,Elife 6 (2017)。
H.S .卡亞-奧庫、S.J .吳、C.A .科多莫、E.S .普萊克爾、T.D .布賴森、J.G .赫尼考夫、k .艾哈邁德、s .赫尼考夫、CUT & amp用於小樣本和單細胞高效表觀基因組分析的標簽,Nat Commun 10(1)(2019)1930。
[24]B. Carter,W.L .,J.Y. Kang,G. Hu,J. Perrie,Q. Tang,K. Zhao,mapping使用抗體引導的染色質標記法在低細胞數和單細胞中進行組蛋白修飾(ACT-seq),Nat Commun 10(1)(2019)3747 .
[25]王,熊,賽,余,劉,張,何,高產量單細胞表觀基因組分析,分子細胞76(1)(2019)206-216e 7 .
[26] A. Harada,K. Maehara,T. Handa,Y. Arimura,J. Nogami,Y. Hayashi-Takanaka,K. Shirahige,H.Kurumizaka,H. Kimura,Y. Ohkawa,壹種染色質整合標記方法能夠以較低的輸入實現表觀基因組分析,Nat Cell Biol 21(2)(2019)287-296。