隨著多組學技術的發展,利用多種組學資料進行復雜疾病的早期診斷,已經成為一項十分重要且需求旺盛的研究方向。
對於多組學整合來說,它能捕捉到疾病在不同分子層面的互補資訊,為更精確的疾病診斷和疾病分類提供了可能。
然而,現有的多組學研究主要集中在提高預測模型的準確性,往往忽視了去尋找具有生物學意義的標誌物。
這一問題在生物醫學領域尤為重要,因為分子之間一般透過相互作用來影響疾病的發生與發展,而不是單獨地發揮作用。
已有研究大多采用人工神經網路來處理高維度的組學資料,並從中學習低維度的表示形式。
例如,自編碼器、、生成對抗網路和圖神經網路等方法,已被廣泛用於這一領域。
特別是圖神經網路方法,由於其在捕捉分子間互動資訊方面的優勢,讓它顯示出了極大的潛力。
然而,這些方法大多關注於構建樣本間的相似性網路,未能充分捕捉分子本身所固有的互動資訊。
除此之外,由於個體的特異性顯著,每個個體的生物標誌物可能存在顯著差異。因此,疾病診斷和標誌物的識別必須從個體層面重新考慮。
此前,領域內的相關研究主要採用全域性或區域性視角來解釋疾病的預測機制,例如透過 SHAP(SHapley Additive exPlanations)方法,來量化每個基因在區分疾病亞群中的鑑別能力。
然而,這些方法往往側重於識別單個生物標誌物,忽略了多分子之間的共功能資訊。
基於此,哈爾濱工程大學團隊提出一款名為 GREMI(GRaph-based Explainable Multi-omics Integration)的框架,旨在解決多組學整合和解釋中的幾個關鍵問題。
(來源:IEEE Journal of Biomedical and Health Informatics)
研究中,他們面臨的核心問題是如何在提高預測效能的同時,保持模型的生物學解釋性。這個難題一度讓課題組陷入困境,因為採用傳統的方法往往難以兼顧這兩個方面。
經過多次的頭腦風暴和深入討論,基於團隊成員對不同領域知識的融合,他們最終提出了一個創新型解決方案:即結合圖神經網路和蒙特卡羅樹搜尋。
透過此,他們設計出一個特殊的圖注意力機制,這不僅能顯著提升模型的預測能力,還能保持高度的可解釋性。
研究人員表示:GREMI 引入了圖注意力網路,故能更好地捕捉組學內部的相互作用,從而能夠生成樣本級別的潛在特徵表示。
同時,透過聯合融合策略和真正類別機率的引入,GREMI 在預測過程中能夠以自適應的方式,評估特徵層次和組學層次的分類置信度,從而能夠提高模型的學習能力和預測效能。
此外,GREMI 框架還引入了模組級別的解釋機制,通過蒙特卡羅樹搜尋演算法在區域性視角下探討子圖,並從全域性視角來識別在疾病表徵中具有高度貢獻的功能模組。
這一模組級別的策略更加直觀,特別適用於解釋複雜疾病的多分子共同作用機制。
總之,本次研究提出了一個新型多組學整合框架,既能提升疾病預測的準確性,又能有效識別具有生物學意義的功能模組,從而能為複雜疾病的早期診斷和機制研究提供新思路和新工具。
日前,相關論文以《GREMI:一個可解釋的多組學整合框架,用於增強疾病預測和模組識別》(GREMI: an Explainable Multi-omics Integration Framework for Enhanced Disease Prediction and Module Identification)為題發在 IEEE Journal of Biomedical and Health Informatics[1]。
梁洪和羅昊燃是第一作者(並列),哈爾濱工程大學姚曉輝副教授擔任通訊作者。
圖 | 相關論文(來源:IEEE Journal of Biomedical and Health Informatics)
對於本次論文,審稿人表示 GREMI 框架在處理複雜疾病的預測和解釋方面取得了顯著進展,並對 GREMI 框架的可解釋性機制表示讚賞。
其認為這種機制不僅能提高模型的預測效能,還能透過識別與疾病相關的功能模組,為學界提供了更加直觀的生物學解釋。
這種模組級別的解釋,非常有助於理解多分子如何透過協同作用來影響疾病結果,並具有廣泛的應用前景:
首先,有望用於面向多種疾病的智慧篩查。
GREMI 框架透過分析患者的多組學資料,可以快速識別多種疾病及其亞型的早期風險。這對於癌症、心血管疾病、神經退行性疾病等早期難以察覺的疾病尤其具有價值。
其次,有望用於個性化醫療。
GREMI 框架能夠根據多組學資料更準確地進行疾病診斷和亞型分類,為個性化治療方案的制定提供科學依據。
再次,有望用於生物標誌物的發現。
透過模組級別的解釋機制,GREMI 框架可以幫助研究人員識別出與疾病相關的功能模組,這些模組可能成為新藥研發或治療靶點的候選者。
最後,有望用於複雜疾病的機制研究。
GREMI 框架可以幫助揭示不同分子如何透過相互作用共同影響疾病的發生與發展。
而基於本次成果,課題組計劃擴充套件 GREMI 框架,以納入更多型別的組學資料,比如納入代謝組學和表觀基因組學,以便進一步提高疾病預測的準確性和模型的泛化能力。
此外,他們還計劃將 GREMI 用於更多的疾病型別,以驗證其在不同病理條件下的適用性,並探索其在疾病治療靶點發現上的潛力。
相關程式碼以及詳細的使用說明已經全部開源,歡迎對此項工作感興趣的科研工作人員下載、使用,並反饋問題 [2]。
參考資料:
1.https://ieeexplore.ieee.org/document/10629044/authors
2.https://github.com/Yaolab-fantastic/GREMI
運營/排版:何晨龍
01/
02/
03/
04/
05/