作為識別和確定蛋白質結構的一種手段,人工智能 (AI) 越來越強大。例如,它不再局限于蛋白質單體的研究。它開始采用蛋白質復合物。然而,與真核生物相比,人工智能更擅長模擬原核生物中的蛋白質復合物。為什么?因為當人工智能試圖識別可能相互作用的蛋白質對時,如果進化信息可用,它會表現得更好,而且很多。原核生物當然就是這種情況。
原核物種的數量遠遠超過真核物種。因此,對于原核物種,有更多的機會來檢測共同進化的蛋白質??紤]兩個蛋白質復合物的情況。據推測,這種復合體中的每個蛋白質都必須有一個相互作用域來補充另一個蛋白質中的相互作用域——任何影響一個蛋白質相互作用域的突變都必須伴隨著影響另一個蛋白質相互作用域的突變。否則,蛋白質最終將停止相互作用。
除了原核物種的絕對數量之外,還有其他因素可以簡化原核蛋白質復合物的分析。例如,在原核生物中,蛋白質較少,可變剪接和基因組復制輪次是非典型的。這些因素減少了科學家在嘗試以計算方式模擬原核蛋白質復合物時必須處理的“噪音”。
盡管真核蛋白質復合物的計算分析更具挑戰(zhàn)性,但華盛頓大學蛋白質設計研究所和德克薩斯大學西南醫(yī)學中心的研究人員并沒有氣餒。他們決定使用兩種基于深度學習的結構預測方法 RoseTTAFold 和 AlphaFold 來應對計算挑戰(zhàn)。華盛頓大學發(fā)明的 RoseTTAFold 用于計算蛋白質對的接觸概率。AlphaFold 由 Alphabet 子公司 DeepMind 發(fā)明,用于重新評估交互概率和建模復雜結構。
通過利用蛋白質組范圍的氨基酸協同進化分析和基于深度學習的結構建模,科學家們系統(tǒng)地識別并構建了釀酒酵母蛋白質組中核心真核蛋白質復合物的準確模型??茖W家們在11 月 11 日發(fā)表在《科學》雜志上的一篇文章(“核心真核蛋白質復合物的計算結構”)中詳細介紹了這項工作。
“[我們篩選]了 830 萬對酵母蛋白的配對多重序列比對,”該文章的作者寫道。“[我們確定] 1,505 個可能相互作用并為 106 個以前未識別的組件和 806 個尚未進行結構表征的組件[構建]結構模型。這些復合體具有多達五個亞基,幾乎在真核細胞的所有關鍵過程中都發(fā)揮作用,并為生物學功能提供了廣泛的見解。”