從調控功能到促進突變,具有雙刃劍角色的非雙螺旋DNA結構正揭開它神秘的面紗。
撰文 | 錢勝
01
DNA結構的多樣性
在格里菲斯(Frederick Griffith)和艾弗裡(Osward Avery)等人的鏈球菌轉化實驗確定了DNA是生物體遺傳資訊的載體後,沃森(James D. Watson)和克里克(Francis Crick)等人於1953年揭示了DNA的二級結構模型——右手雙螺旋結構(Double helix structure,又稱B型DNA)(圖一A),兩條反向平行的DNA鏈螺旋盤繞,磷酸基團構成DNA鏈的骨架,內側的鹼基根據互補配對原則透過氫鍵結合[1]。自此,DNA的雙螺旋結構深入人心,逐漸成為代表生命科學的符號。
實際上,DNA除了雙螺旋結構,還可以形成其他的非B型DNA結構(圖一B-G),包括左手雙螺旋的Z DNA(B)、鳥嘌呤富集區域形成的G-四鏈體(G-quadruplex)(C)、DNA串聯重複錯配形成的Slipped DNA(D)、高GC含量的映象重複區形成的三鏈DNA結構(H DNA)(E)、倒轉重複序列兩條臂(Arm)互補配對形成的髮夾結構(F)和十字架結構(G)[2]。此外,胞嘧啶富集的序列在酸性條件下可能形成四鏈的i-motif結構。據估計,這些非B型DNA結構占人類基因組總長度的13%左右,結構的多樣性使其能在細胞中發揮多樣的功能,因而也受到不同的自然選擇作用[3]。
圖一:雙螺旋B型DNA和其他非B型DNA。圖片來自引文[2]
02
什麼是G-四鏈體?
G-四鏈體(簡稱G4)是研究最為廣泛的非B型DNA,由四個鳥嘌呤(Guanine)透過Hoogsteen氫鍵連線形成的G-四分體(G-quartet)堆疊而成。對G4的研究最早可以追溯到1910年,德國化學家Ivar Bang發現高濃度的富含鳥嘌呤核苷酸的序列能形成凝膠,這一不同尋常的性質困惑了科學界長達50年之久[4]。直到Gellert等人透過X射線衍射技術發現鳥嘌呤能透過氫鍵連線形成G-四分體平面結構並進一步堆疊形成三維的G4結構,從而具有凝膠狀的特性,這一謎題才被解開[5]。
03
G-四鏈體的分佈和功能兩面性
G4在從微生物到人類的細胞中廣泛存在,其總長度約佔人類基因組的1%,分佈在端粒、啟動子、增強子等區域[6]。G4在基因組中有著雙刃劍的作用(圖二):一方面,端粒區的G4結構能抑制核酸酶的活性,防止端粒被核酶降解[7]。啟動子區形成的G4是轉錄因子結合的熱點區域,進而增強下游基因的轉錄。例如,原癌基因MYC啟動子區的G4對於招募轉錄因子和染色質調節蛋白是至關重要的,CRISPR技術破壞G4結構的形成會顯著降低MYC的表達水平。近日,中國科學院長春應用化學研究所曲曉剛研究員團隊將CRISPR與G4結合蛋白/配體結合,開發出特異性靶向G4的方法進而改變目標基因的表達水平,表明G4是基因表達操縱的潛在靶標[8]。此外,DNA複製起點上游的G4能啟用DNA複製複合物,起始DNA的複製過程。另一方面,在DNA複製的過程中,富含鳥嘌呤的DNA區域可能形成G4,形成空間位阻阻礙DNA聚合酶的透過,進而抑制DNA的複製並增加複製錯配和雙鏈斷裂的機率,最終誘導突變的發生。有研究表明G4的形成是癌細胞中基因組結構變異產生的關鍵因素[9]。
圖二:G4在基因組中的雙重作用。左側代表G4的有益作用(Blessing),如保護端粒、招募轉錄因子調控基因表達和促進複製起始;右側表明G4的有害作用(Curse),如複製過程中G4結構形成物理空間位阻可能阻礙DNA聚合酶的透過。圖片來自引文[7]。
04
G-四鏈體的演化及選擇壓力
有功能的基因元件往往會受到負向選擇在基因組中保留,而有害的元件通常會被自然選擇清除。G4在基因組中的雙重角色使其可能受到兩種截然相反的選擇作用。在病毒中,基於G4 motif分析結果顯示感染原核和真核生物的病毒基因組對G4的選擇偏好不同,主要感染原核生物的病毒基因組傾向於保留序列較短和穩定性較低的G4,而主要感染真核生物的病毒基因組則偏好結構更加穩定的G4[10]。這可能是由於病毒基因組複製過程中G4的解鏈需要藉助宿主的解旋酶和能量,而原核宿主的細胞中酶系統比較簡單,只能解鏈結構穩定性較低的G4,因而感染原核細胞的病毒傾向保留結構穩定性較低的G4。
一項橫跨多個類群物種的研究發現簡單生命系統的核基因組中G4密度較低,而在生命系統更為複雜的物種中,G4的密度更高、單個G4的長度也更長11。線粒體中G4的演化趨勢與核基因組相同(圖三),G4的數量和密度在演化過程中均呈現出逐漸增加的趨勢(圖三、四)[12]。例如,鳥類和靈長類的G4密度顯著高於昆蟲和魚類(圖四)。考慮到GC含量可能影響G4的密度(圖五),用GC含量校正後的G4密度也觀察到相似的結果[11],表明G4密度的增加不是GC含量的升高導致的,可能是自然選擇驅動的結果。同時,基因組中不同區域對G4的選擇也存在偏好[6, 7]。啟動子、CpG島和DNA複製起始位點等功能區的G4密度較高,而重組熱點區域和染色質拓撲結構域(TAD)邊界的G4受到純化選擇作用較強,外顯子區對應的非轉錄鏈上的G4受到純化選擇作用較弱、密度和熱穩定性也較低,表明G4不傾向於在RNA分子上產生。因此,不同物種中的酶系統的複雜程度、基因組不同區域的功能及位置共同決定了G4受到的演化壓力。
圖三:不同物種線粒體DNA中G4的數量。圖中資料來自引文[12]。
圖四:不同類群的物種線粒體DNA的G4密度。PQS代表預測的G4。圖片來自引文[12]。
圖五:不同物種線粒體DNA的GC含量和G4丰度的相關性。R和S分別表示Pearson和Spearman相關性。圖片來自引文[12]。
05
總結
遺傳物質的多樣性是物種適應環境變化的重要保證。同樣地,生物大分子的結構往往決定其生理特性和功能,DNA結構的多樣性也是遺傳物質多樣性的重要組成成分,有助於物種對環境的適應。然而,由於缺乏有效的鑑定方法,非B型DNA在基因組中的功能長期被忽略。G4作為其中的代表,大部分關於G4的研究也主要依賴於基於序列的預測方法,其結果與細胞中真實存在的G4可能存在較大差異,關於G4的功能和演化模式還需要未來更多更直接的證據。
雙螺旋結構萬口傳,至今已覺不新鮮;
DNA新構象代代出,各領風騷數百年。
參考文獻
[1] Watson J D, Crick F H C. Molecular structure of nucleic acids: a structure for deoxyribose nucleic acid[J]. Nature, 1953, 171(4356): 737-738.
[2] Georgakopoulos-Soares I, Victorino J, Parada G E, et al. High-throughput characterization of the role of non-B DNA motifs on promoter function[J]. Cell genomics, 2022, 2(4).
[3] Guiblet W M, Cremona M A, Cechova M, et al. Long-read sequencing technology indicates genome-wide effects of non-B DNA on polymerization speed and error rate[J]. Genome Research, 2018, 28(12): 1767-1778.
[4] Bang I. Untersuchungen über die Guanylsäure[J]. Biochem. Z, 1910, 26: 293-311.
[5] Gellert M, Lipsett M N, Davies D R. Helix formation by guanylic acid[J]. Proceedings of the National Academy of Sciences, 1962, 48(12): 2013-2018.
[6] Guiblet W M, DeGiorgio M, Cheng X, et al. Selection and thermostability suggest G-quadruplexes are novel functional elements of the human genome[J]. Genome research, 2021, 31(7): 1136-1149.
[7] Makova K D, Weissensteiner M H. Noncanonical DNA structures are drivers of genome evolution[J]. Trends in Genetics, 2023, 39(2): 109-124.
[8] Qin G, Liu Z, Yang J, et al. Targeting specific DNA G-quadruplexes with CRISPR-guided G-quadruplex-binding proteins and ligands[J]. Nature Cell Biology, 2024: 1-13.
[9] Zhang R, Shu H, Wang Y, et al. G-quadruplex structures are key modulators of somatic structural variants in cancers[J]. Cancer Research, 2023, 83(8): 1234-1248.
[10] Li Z, Qian SH, Wang F, et al. G-quadruplexes in genomes of viruses infecting eukaryotes or prokaryotes are under different selection pressures from hosts[J]. Journal of Genetics and Genomics, 2022, 49(1): 20-29.
[11] Wu F, Niu K, Cui Y, et al. Genome-wide analysis of DNA G-quadruplex motifs across 37 species provides insights into G4 evolution[J]. Communications biology, 2021, 4(1): 98.
[12] Sahayasheela V J, Yu Z, Hidaka T, et al. Mitochondria and G-quadruplex evolution: an intertwined relationship[J]. Trends in Genetics, 2023, 39(1): 15-30.
本文經授權轉載自微信公眾號“ZJU生命演化研究”,原題目為《不只雙螺旋,DNA結構的多樣性和演化》,編輯:劉峰。
特 別 提 示
1. 進入『返樸』微信公眾號底部選單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位陣列成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。