蛋白質(zhì)對于細胞生命,執(zhí)行復(fù)雜任務(wù)和催化化學反應(yīng)至關(guān)重要。長期以來,科學家和工程師一直在尋求通過設(shè)計可以執(zhí)行新任務(wù)(例如治療疾病,捕獲碳或收集能量)的人造蛋白質(zhì)來利用這種力量的方法,但是許多設(shè)計此類蛋白質(zhì)的過程緩慢而復(fù)雜,且失敗率很高。率。
這項可能對醫(yī)療,農(nóng)業(yè)和能源領(lǐng)域產(chǎn)生重大影響的突破是由芝加哥大學普利茲克分子工程學院(PME)的研究人員領(lǐng)導(dǎo)的一個團隊開發(fā)的一種以人工智能為主導(dǎo)的流程,該流程利用大數(shù)據(jù)來設(shè)計新的蛋白質(zhì)。
通過開發(fā)可以回顧從基因組數(shù)據(jù)庫中選出的蛋白質(zhì)信息的機器學習模型,研究人員發(fā)現(xiàn)了用于構(gòu)建人工蛋白質(zhì)的相對簡單的設(shè)計規(guī)則。當團隊在實驗室中構(gòu)建這些人造蛋白質(zhì)時,他們發(fā)現(xiàn)它們的化學反應(yīng)非常出色,可以與自然界中的蛋白質(zhì)媲美。
普利茲克分子工程學院生物化學與分子生物學系的Joseph Regenstein教授Rama Ranganathan說:“我們都想知道像進化這樣的簡單過程如何才能產(chǎn)生出像蛋白質(zhì)這樣的高性能材料。” “我們發(fā)現(xiàn)基因組數(shù)據(jù)包含有關(guān)蛋白質(zhì)結(jié)構(gòu)和功能基本規(guī)則的大量信息,現(xiàn)在我們已經(jīng)能夠利用自然界的規(guī)則來自己創(chuàng)造蛋白質(zhì)。”
結(jié)果發(fā)表在7月24日的“ 科學 ”雜志上。
使用人工智能學習設(shè)計規(guī)則
蛋白質(zhì)由成百上千個氨基酸組成,這些氨基酸序列決定了蛋白質(zhì)的結(jié)構(gòu)和功能。但是,僅了解如何構(gòu)建這些序列以創(chuàng)建新蛋白的方法一直是一項挑戰(zhàn)。過去的工作導(dǎo)致了可以指定結(jié)構(gòu)的方法,但是功能卻更加難以捉摸。
Ranganathan及其合作者在過去15年中意識到,基因組數(shù)據(jù)庫(呈指數(shù)增長)包含有關(guān)蛋白質(zhì)結(jié)構(gòu)和功能基本規(guī)則的大量信息。他的小組基于這些數(shù)據(jù)開發(fā)了數(shù)學模型,然后開始使用機器學習方法來揭示有關(guān)蛋白質(zhì)基本設(shè)計規(guī)則的新信息。
在這項研究中,他們研究了新陳代謝的分支酸突變酶家族,這是一種對許多細菌,真菌和植物的生命至關(guān)重要的蛋白質(zhì)。使用機器學習模型,研究人員能夠揭示這些蛋白質(zhì)背后的簡單設(shè)計規(guī)則。
該模型顯示,僅氨基酸位置的保守性和氨基酸對進化中的相關(guān)性就足以預(yù)測具有蛋白質(zhì)家族特性的新人工序列。
Ranganathan說:“我們通常認為要構(gòu)建某種東西,您首先必須深刻理解它的工作原理。” “但是,如果您有足夠的數(shù)據(jù)示例,則可以使用深度學習方法來學習設(shè)計規(guī)則,即使您正在了解其工作原理或以這種方式構(gòu)建的原因也是如此。”
然后,他和他的合作者創(chuàng)建了合成基因來編碼蛋白質(zhì),將它們克隆到細菌中,然后觀察細菌如何使用其正常的細胞機制來合成蛋白質(zhì)。他們發(fā)現(xiàn),人造蛋白具有與天然分支酸突變酶蛋白相同的催化功能。
一個了解其他復(fù)雜系統(tǒng)的平臺
因為設(shè)計規(guī)則相對簡單,所以研究人員可能用它們創(chuàng)造的人工蛋白質(zhì)數(shù)量非常多。
蘭加納森說:“這些限制比我們想象的要小得多。” “大自然的設(shè)計規(guī)則很簡單,我們相信類似的方法可以幫助我們在生物的其他復(fù)雜系統(tǒng)(例如生態(tài)系統(tǒng)或大腦)中搜索設(shè)計模型。”
盡管人工智能揭示了設(shè)計規(guī)則,但Ranganathan和他的合作者仍不完全了解模型為何起作用。接下來,他們將努力了解模型如何得出此結(jié)論。他說:“還有很多工作要做。”
同時,他們還希望使用該平臺開發(fā)可以解決緊迫的社會問題(例如氣候變化)的蛋白質(zhì)。Ranganathan和Assoc。安德魯·弗格森(Andrew Ferguson)教授成立了一家名為Evozyne的公司,該公司將通過在能源,環(huán)境,催化和農(nóng)業(yè)領(lǐng)域的應(yīng)用將該技術(shù)商業(yè)化。Ranganathan與UChicago的Polsky創(chuàng)業(yè)與創(chuàng)新中心合作,申請了專利并向該公司授予了IP許可。
他說:“該系統(tǒng)為我們提供了一個以我們夢dream以求的方式合理地工程化蛋白質(zhì)分子的平臺。” “它不僅可以教會我們有關(guān)蛋白質(zhì)如何工作以及如何進化的物理學,它還可以幫助我們找到諸如碳捕獲和能量收集等問題的解決方案。更廣泛地講,蛋白質(zhì)研究甚至可以幫助我們了解深層神經(jīng)現(xiàn)代機器學習背后的網(wǎng)絡(luò)確實有效。”