逆合成分析法是當今有機合成化學的重要手段之一,這種方法揭示了如何將所需分子分解為更簡單的化學構建塊,然后化學家可以采取必要的反應步驟,用這些簡單的結構單元制備所需的分子,用于制造藥物和其他產品。然而傳統的計算機輔助方式合成速度仍然較慢,且提供的分子質量參差不齊。人類還是需要手動搜索化學反應數據庫,來找到制造分子的最佳方法。

傳統逆合成分析法示意圖
為了解決這一問題,Waller教授團隊使用蒙特卡洛樹搜索(Monte Carlo tree search,MCTS)和與指導搜索的擴展策略網絡以及篩選網絡相結合,形成了一種新的人工智能算法。來預測那些并未包含在訓練數據集中的小分子合成路線。
研究人員使用2015年之前發布的所有化學反應作為數據,來對這種新型算法進行訓練,讓這種算法可以自己學習一套“規則”,來預測那些并未包含在訓練數據集中的小分子合成路線。
AI算法探索不同的化學路徑

研究結果表明,這種新型的算法在單個分子限制時間為5秒鐘的情況下,能夠對測試集中80%的分子合成路線進行預測。當單個分子用時限制延長至60秒時,新型算法預測分子合成路線的比例達到了92%。這一結果比傳統的計算機輔助合成路線設計加快了近30倍。并且在隨后進行的雙盲測試中,化學家們無法針對同一個分子,對算法預測出的合成路線以及原始文獻中的合成路線進行有效區分,從側面說明了這種新型算法預測的準確性。
“在過去的60年里,科學家們一直試圖通過人工編碼的方式,將合成規則指定給計算機,”Waller博士在論文中寫道:“和傳統方法不同的是,我們使用了具備規劃能力、符號象征能力及自動化學習能力的強大算法,這對于計算機能否在化學合成中發揮輔助作用至關重要。而這一技術也為滿足人類在農業、醫療及材料科學等領域的需求奠定了堅實的基礎。”
隨著人工智能技術的不斷發展,其已經開始在化學合成領域發揮強大的作用。我們也希望,未來的人工智能可以在更加多樣的科研領域內,實現越來越多的突破。
原文來自:nature
化學慧定制合成事業部摘錄