產品概述
蛋白質-蛋白質互作(PPI)在動植物生物學中扮演了關鍵角色,它們驅動了許多細胞功能和生物過程。因此,識別蛋白質間的互作對於理解生物機制及開發藥物和生物技術應用至關重要。傳統的篩選方法(如Y2H、COIP等)驗證蛋白互作往往耗時長、效率低,並且需要大量的實驗資源。為了提高篩選效率,近年來高通量虛擬篩選技術和AI模型的進步使得基於結構和序列的互作預測成為了可能。
本產品旨在利用前沿的生成模型RFdiffusion從頭設計人造高互作蛋白質,並結合Foldseek、HDOCK和AlphaFold 3等先進工具,對天然蛋白質進行篩選和驗證。我們將這套新型計算工作流程命名為InterProDesign(IPD,Interaction Protein Design)。透過IPD能夠更加高效且精準地篩選出與誘餌蛋白相互作用的天然蛋白,為進一步的實驗驗證提供重要參考。
產品流程
參考文獻指示該計算工作流程實驗驗證成功率超過78%,為研究動植物生物機制提供重要的結構生物學資訊。
1
RFdiffusion設計互作蛋白
基於已知誘餌蛋白結合熱點的判斷,從頭設計10條不同長度的高互作蛋白質。
2
Foldseek搜尋天然蛋白
在目標物種的蛋白質三維結構資料庫,比對尋找結構相似的天然蛋白,(僅保留
bit score>50的匹配結果),並按分數高低排序(最多前100)。
3
結合能評價和整體結構評估
對於上一輪Foldseek篩選出的高分天然蛋白,使用HDOCK工具評估它們與誘餌蛋白之間的量化結合能,篩選出結合能較高的天然蛋白。接著,使用AlphaFold 3進一步評估這些互作蛋白與誘餌蛋白的整體複合結構的置信度。
向上滑動檢視更多
擬交付結果示意
NEW TECNOLOGY
如圖1,資料總表中包括所有步驟的彙總結果。紅色方框內是RFdiffusion 基於誘餌蛋白所自主設計的10條互作蛋白序列,並將人造蛋白與誘餌蛋白對接評估。
綠色方框內是Foldseek 根據設計蛋白從待選物種庫內篩選得到的結構相似天然蛋白。其中也存在人造蛋白沒有bit score大於50的天然蛋白。
藍色方框內是誘餌蛋白與候選天然蛋白從量化結合能和整體置信度評估的結果,穩定互作的高評分蛋白已標紅強調,可以為後續實驗驗證提供指導。
如圖2所示,是所有候選蛋白的詳細資訊,包括蛋白質的ID、基因名稱、序列、物種、亞細胞定位、功能註釋和所屬家族。
圖1: 資料總表示意圖
圖2: 候選蛋白註釋資訊
產品優勢
NEW TECNOLOGY
1
創新型計算方法
本產品基於計算模型的預測與篩選流程,可以大幅縮短篩選時間並減少實驗工作量。透過RFdiffusion、Foldseek、HDOCK和AlphaFold等工具的結合,能夠在早期階段快速預測出與誘餌蛋白可能發生互作的候選蛋白。多維度評估使得最終篩選出的互作蛋白更加可靠,提升了後續實驗驗證的成功率。
2
結構導向型的精確篩選
本產品更多依賴蛋白質的三維結構進行篩選。結構相似性在跨物種或功能多樣性大的蛋白質互作中的至關重要。基於結構的篩選方法能夠識別出那些序列相似度低但具有相似功能的蛋白質。
參考文獻
1.Watson, J. L., et al. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620, 1089-1099.
2.Haley, O. C., Harding, S., Sen, T. Z., Woodhouse, M. R., Kim, H.-S., Andorf, C. (2024). Application of RFdiffusion to predict interspecies protein-protein interactions between fungal pathogens and cereal crops. bioRxiv, doi: 10.1101/2024.09.17.613523.
3.Watson, J. L., Juergens, D., Bennett, N. R., Trippe, B. L., Yim, J., Eisenach, H. E., ... & Baker, D. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620(7685), 1089-1098.
4.Baek, M., DiMaio, F., Anishchenko, I., Dauparas, J., Ovchinnikov, S., Lee, G. R., ... & Jumper, J. (2021). Accurate prediction of protein structures and interactions using a three-track neural network. Science, 373(6557), 871-876.
5.Lin, Z., Rigden, D. J., & McGuffin, L. J. (2023). Language models of protein sequences at the scale of evolution enable accurate structure prediction. Science, 379(6631), 1123-1130.
6.Dauparas, J., Anishchenko, I., Bennett, N. R., Bai, H., Ragotte, R. J., Milles, L. F., ... & Baker, D. (2022). Robust deep learning-based protein sequence design using ProteinMPNN. Science, 378(6615), 49-56.
關於科晶生物
合肥科晶生物致力於計算機虛擬篩選推動生物學發展,幫助篩選互作蛋白、轉錄因子、潛在藥物以及奈米抗體。
福利來襲!
科晶生物論文出圖
免費蛋白互作分析等您來領!
0551-64669001
掃碼新增客服,即可領取!
NEWS
AI DOCKING