——解讀 ACS Synthetic Biology 2025 新研究
Cell-Free Protein Synthesis as a Method to Rapidly Screen Machine Learning-Generated Protease VariantsThornton et al., ACS Synth. Biol., 2025
一、為什么“機器學習設(shè)計蛋白",仍然離不開實驗?
近年來,機器學習(Machine Learning, ML)在蛋白科學領(lǐng)域的影響力迅速擴大。從 AlphaFold 帶來的結(jié)構(gòu)預測革命,到各類序列生成模型用于蛋白設(shè)計,算法正在以未有的速度探索蛋白序列空間。
然而,一個現(xiàn)實問題始終存在:算法只能“提出假設(shè)",而蛋白功能的優(yōu)劣,仍然必須由實驗數(shù)據(jù)來驗證。
尤其是在酶工程和功能蛋白優(yōu)化中,ML 模型對訓練數(shù)據(jù)提出了更高要求——不僅要多,還要真實反映蛋白功能差異。傳統(tǒng)依賴細胞表達、純化和動力學表征的流程,往往周期長、通量有限,很容易成為 ML 迭代的瓶頸。
在這一背景下,Thornton 等人在 ACS Synthetic Biology 發(fā)表的這項研究,給出了一個具代表性的解決思路:
?? 將無細胞蛋白合成(CFPS)直接嵌入機器學習驅(qū)動的蛋白設(shè)計流程中。

二、研究思路一覽:一個典型的“Create–Test–Learn"閉環(huán)
這項研究圍繞一種人工設(shè)計的蛋白酶 Con1 展開,目標是提升其催化活性。整體流程可以概括為三個階段:
Create(設(shè)計)
基于結(jié)構(gòu)預測和計算分析,篩選出可能影響底物結(jié)合的關(guān)鍵殘基區(qū)域,并進行多位點突變設(shè)計;
Test(測試)
利用無細胞蛋白合成體系,在體外快速合成蛋白變體,并直接進行酶活性檢測;
Learn(學習)
將“序列—功能"數(shù)據(jù)輸入主動學習算法(ALDE),由模型推薦下一輪更有潛力的突變組合。
通過僅兩輪篩選、約百個變體,研究者成功獲得了酶活性提升約 4 倍的突變體,展示了該流程在效率上的顯著優(yōu)勢。

Create–Test–Learn 工作流程示意圖(Thornton et al., ACS Synth. Biol., 2025)
三、無細胞蛋白合成在這里“厲害"在哪里?
值得注意的是,作者并沒有把 CFPS 當作“傳統(tǒng)細胞表達的替代方案",而是將其定位為機器學習實驗數(shù)據(jù)的加速器。
從方法學角度來看,CFPS 在這一工作中體現(xiàn)出三點關(guān)鍵價值:
快速獲得“可比較"的功能數(shù)據(jù)
研究中并未追求嚴格的動力學絕-對參數(shù),而是通過統(tǒng)一條件下的反應初始速率作為 fitness 指標。事實證明,這種相對比較數(shù)據(jù)已經(jīng)足以支撐 ML 對突變體優(yōu)劣的判斷。
開放體系,實驗設(shè)計更自由
無細胞體系不受細胞生存、毒性或底物通透性限制,尤其適合早期功能篩選和多突變組合的測試。
實驗速度,決定 ML 是否真正“跑得動"
當一輪蛋白表達和功能測試可以在數(shù)小時內(nèi)完成,機器學習的“主動學習"優(yōu)勢才能被真正釋放。

CFPS 與純化蛋白活性對比(Thornton et al., ACS Synth. Biol., 2025)
四、從文獻到產(chǎn)業(yè)實踐:穩(wěn)定 CFPS 平臺的重要性
文中作者也明確指出,如果采用更成熟、標準化的無細胞蛋白合成體系,該流程在通量、重復性和自動化方面仍有提升空間。
這恰恰反映了當前行業(yè)的一個重要趨勢:無細胞蛋白合成正在從“實驗室方法",演進為“工程化工具"。
在這一方向上,珀羅汀生物(PLD Technology)正致力于將無細胞蛋白表達打造成可直接嵌入蛋白設(shè)計、篩選和驗證流程的通用工具,服務于酶工程、功能蛋白研究以及 AI 蛋白設(shè)計等場景。
當 CFPS 不再需要研究者投入大量精力進行體系搭建,而是能夠穩(wěn)定輸出高質(zhì)量蛋白和功能數(shù)據(jù)時,機器學習模型的優(yōu)勢才能被充分放大。

珀羅汀生物聯(lián)合自動化儀器進行高通量篩選應用
五、總結(jié):蛋白工程的核心競爭力正在發(fā)生變化
這項研究傳遞出一個非常清晰的信號:
未來蛋白工程的競爭,不僅是算法的競爭,也不僅是實驗技術(shù)的競爭,而是“數(shù)據(jù)生成效率 × 設(shè)計迭代速度"的綜合競爭。
無細胞蛋白合成,正在成為連接“計算設(shè)計"與“實驗驗證"的關(guān)鍵橋梁。而當這一橋梁足夠穩(wěn)定、足夠快速,蛋白工程的創(chuàng)新節(jié)奏也將被重新定義。
掃一掃,關(guān)注微信
微信掃一掃