總所周知,生物體的遺傳資訊主要由(DNA)上腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C) 和鳥嘌呤(G)四種鹼基千變萬化的排列順序所承載和傳遞。除了這四種經典鹼基組成外,生物體時常會對某些經典鹼基或核苷(nucleoside)進行細微的再加工(如甲基化,羥甲基化等),產生表觀遺傳修飾後的鹼基或核苷,從而進一步提高遺傳資訊編碼的多樣性、實現不改變DNA序列前提下的遺傳資訊可調控度。長期以來,甲基化修飾的胞嘧啶(5-methylcytosine, 5mC)被公認為繼A、T、C、G四種鹼基後的第五種鹼基,有時甚至被用作DNA甲基化(DNA methylation)這一類重要表觀遺傳修飾(epigenetic marks)的代名詞,但其實DNA上還存在著多種潛在的表觀遺傳修飾,其中N6-甲基腺嘌呤(DNA N6-methyladenine, 6mA)就是其中較為重要的一個。
事實上,儘管5-甲基胞嘧啶(5mC)是真核細胞基因組上丰度最高的表觀修飾,在原核生物如細菌的DNA上,6mA是最為普遍的 DNA 修飾形式,並在錯配修復(mismatch repair)、DNA 複製和轉錄中發揮著重要的調控作用。不過在物種進化過程中,6mA在原核細胞中的高丰度和重要調節功能,似乎逐漸被5mC所代替,以至於在動物、尤其是哺乳動物細胞的基因組中,6mA修飾普遍維持在很低的水平,其未充分明確的分佈規律、可能的調控、以及生物學功能引人好奇,目前在領域內也一直存在著不少為之爭論的聲音()。
工欲善其事,必先利其器。可以想見,想要徹底釐清6mA在哺乳動物的特點和功能,研究人員首先需要解決的問題是,如何能在如此龐大的哺乳動物基因組中更可靠、更精準地檢測出低水平的6mA修飾所在的位置。
2024年1月11日,芝加哥大學何川(Chuan He)實驗室在Molecular Cell上發表Technology文章Sequencing of N6-methyl-deoxyadenosine at single-base resolution across the mammalian genome,為便捷高效地測定6mA位置和修飾水平提供了一種全新的二代測序方法。
如何能在全基因組測序中,將存在共價修飾(covalent modification)的鹼基與未加修飾的A、T、C、G鹼基區分開?對這一問題的不同回答指向了多種多樣的表觀修飾測序策略。最簡單常見的思路是使用特異性針對修飾鹼基的抗體進行免疫沉澱(immunoprecipitation)和隨後的二代測序,但這種策略的缺陷也十分明顯:非特異性高、鹼基水平分辨度低、無法直接對單鹼基上修飾水平(modification fraction)進行測定。針對C上的修飾,前人發現了一種更為高效的策略,即用亞硫酸氫鹽(bisulfite)處理DNA,將未被修飾的C轉化為尿嘧啶(U),5mC等修飾後的鹼基不受影響,從而通過後續的測序找出5mC等修飾在基因組中出現的位置和修飾水平(Frommer et al, 1992)。然而,亞硫酸氫鹽僅對C鹼基有這種作用,對於C外的其他鹼基,暫時沒有類似的高效化合物能夠使用。
在這樣的背景下,何川實驗室注意到6mA相比未修飾的A,在與T進行互補配對時,形成的沃森-克里克氫鍵較弱,但依然偏好與T而非其他鹼基發生配對。基於這一點,研究人員進一步推想,是否能夠進一步削弱6mA與T之間的氫鍵,使之不再能與T順利發生配對,而選擇與其他三種鹼基發生配對。如此一來,6mA所在位置在二代測序資料中就有可能不再表現為A,而是體現為“錯配”(mismatch)和“突變”(mutation)。有了這個想法後,研究人員進行了一系列嘗試,最終發現,當使用2-硫代-dTTP (2-thio-dTTP) 替代DNA延伸反應中的dTTP,額外在反應體系中加入一定量鎂離子和聚乙二醇(PEG),並且使用Bst 2.0 DNA聚合酶且在較低的延伸溫度下時,6mA不能順利和2-thio-dTTP進行配對,而同時會和dATP、dGTP、dCTP發生不同比例的錯配。而未修飾的A仍主要與2-thio-dTTP形成配對。為了能利用這一策略更為精確可靠地測定6mA修飾位置和修飾水平,研究人員還設定了兩個陰性對照測序文庫(sequencing library):用FTO預先對6mA修飾進行抹除的去甲基化對照文庫;用Q5高保真DNA聚合酶延伸的無錯配對照文庫。只有在兩個陰性對照測序文庫中沒有顯著錯配的位點,才被認定為預測的6mA位點。同時,在所有文庫的建立時還加入了攜帶一系列已知6mA修飾水平的人工合成短DNA(spike-in probes),用於對基因組DNA上6mA修飾位點進行從錯配率(mismatch ratio)到修飾水平的標定(calibration)和換算。由於這種6mA檢測方法不需要額外對6mA或者A進行任何處理或轉變,直接用Bst 2.0 DNA聚合酶對基因組DNA進行 “讀取”即可,由此被命名為DR-6mA-seq。
研究人員首先在人工合成DNA上衡量了DR-6mA-seq的表現,證明了此策略能夠便捷、單鹼基分辨度、較高準確性和靈敏度地對6mA位點進行檢測。隨後,他們將其應用於基因組小、甲基化水平高、6mA圖譜明確的大腸桿菌(E. coli K-12)DNA上,測定出約21500個高置信度的6mA位點,且大部分位點的修飾程度接近100%,與此前三代測序(SMRT)結果高度統一,而測序顯示的6mA修飾富集的一致性序列(consensus motif)正是已知的大腸桿菌K-12菌株的僅有兩種6mA甲基轉移酶的識別序列。這說明DR-6mA-seq是測定原核基因組6mA修飾的便捷、可靠的新方法。
真核生物尤其是哺乳動物基因組比原核生物龐大得多,而6mA丰度和修飾程度卻更低,因此長期以來哺乳動物基因組6mA的測定充滿難度。儘管在大腸桿菌基因組上表現優異,DR-6mA-seq在哺乳動物基因組上的表現仍需驗證。由於此前一項基於質譜和抗體的測序研究發現,比起正常細胞,人膠質母細胞瘤幹細胞以及原代膠質母細胞瘤中的6mA修飾水平顯著提高(Xie et al, 2018),因此研究人員選取了NIH/3T3和B104-1-1這一對互為對照的細胞系作為驗證物件。B104-1-1是由胚胎成纖維細胞NIH/3T3透過表達啟用的Erbb2癌基因轉化而來,是一種膠質母細胞瘤模型細胞系。透過質譜(UHPLC-QQQ-MS/MS)和DR-6mA-seq,研究人員均發現,B104-1-1中6mA修飾的水平比起其母細胞系NIH/3T3大幅提高約4倍,且B104-1-1新出現的6mA修飾位點更多地出現在LINE, LTR, SINE, satellite等非編碼區域,這一點也與此前用不同方法在其他哺乳動物細胞中測定得到的結論較為一致。總體來說,哺乳動物基因組上6mA位點的修飾程度均較低,序列一致性較低。為了研究這些6mA修飾的可能功能,研究人員還將B104-1-1中6mA修飾圖譜與多種組蛋白修飾的ChIP-seq圖譜進行了比對,發現6mA修飾和異染色質特異的組蛋白修飾:H3K27me3呈現顯著的共定位,但在NIH/3T3細胞中卻沒有觀察到這一現象。這提示了膠質母細胞瘤中的6mA修飾可能與H3K27me3存在相互作用,並且與腫瘤細胞的發生或維持有著重要的關聯。
總體而言,DR-6mA-seq作為一種單鹼基分辨度的6mA修飾二代測序方法,是目前最便捷和可靠的6mA全基因組測定手段之一。除此之外,它突破性地採用了人工修飾的脫氧核糖核苷三磷酸(dNTP)作為區分修飾和未修飾鹼基的有力工具,這一策略將來值得被運用在其他DNA和RNA共價修飾的檢測上。
何川(Chuan He)教授為本研究的通訊作者,博士生馮欣然(Xinran Feng)、博士後崔曉龍(Xiaolong Cui)和張理升(Li-Sheng Zhang)為共同第一作者。
https://doi.org/10.1016/j.molcel.2023.12.021