密蘇里大學林見團隊《JACS》:機器學習輔助金屬有機納米膠囊的合成

高分子科學前沿 發佈 2020-01-21T06:44:17+00:00

相關研究成果以題為「MachineLearning Assisted Synthesis of Metal-Organic Nanocapulses」發表在化學專刊Journal of the American Chemical Society上。

傳統的材料研發和合成面臨一些巨大的挑戰。特別是一些組分或者結構複雜的材料,比如有機分子,高分子,有機無機混合材料,因為它們化學空間和合成路徑的巨大的可調性,往往需要巨大的試錯成本。並且在這一過程中還需要很有經驗和化學直覺的實驗者設計完成實驗。所以研發新的工具可以幫助高效快速地探索合成反應空間最近因著機器學習的興起成為新的研究熱點。其中金屬有機納米膠囊(metal-organic nanocapsules)的合成就是其中一種。因其在催化、氣體吸附與分離、傳感器等領域的優異表現而引起研究學者的極大興趣。然而,跟其它材料合成一樣,金屬有機納米膠囊的合成依然依賴繁瑣複雜且低效的試錯路徑。最近,密蘇里大學機械工程系林見課題組聯合該校化學系有機化學教授Jerry L. Atwood課題組提出了機器學習算法輔助材料合成。該算法利用已經完有的實驗數據(包括成功的和失敗的實驗)可成功預測給定反應條件下金屬有機納米膠囊的結晶與否(準確率大於90%),從而極大減少因試錯過程中產生的人力物力的投入,縮短新型金屬有機納米膠囊的發現周期。最重要的是算法可以幫助提取材料合成隱藏的信息,從而有助於培養實驗者的化學直覺。相關研究成果以題為「Machine Learning Assisted Synthesis of Metal-Organic Nanocapulses」發表在化學專刊Journal of the American Chemical Society上。

首先,研究人員將從實驗記錄本中整理出的486個實驗數據作為原始數據集,包含193個反應產物出現單晶的記錄(標記為1)與293個無任何反應或生成沉澱的記錄(標記為0),見上圖。根據個人經驗與文獻閱讀,我們確定了17條可能影響金屬有機納米膠囊結晶的化學特徵,並將上述原始數據集按照7/3的比例劃分為訓練集與測試集。

研究人員比較九種不同的機器學習算法,發現XGBoost算法表現出最高的預測準確率91 %和F1檢驗值87 %,同時也具有最高的AUC值、召回率和精確率,見上圖。

其次,研究人員通過XGBoost的特徵重要性函數,發現合成製備金屬有機納米膠囊過程中,試劑、有機配體、調節劑和陽離子是最主要的是否形成單晶的影響因素,見上圖。另外研究人員還發現,即使化學特徵的數量由原來的17個減少到6個,XGBoost算法依然表現出極高的魯棒性。

再其次,研究人員通過對XGBoost決策過程的詳細研究,總結了三條製備金屬有機納米膠囊單晶的可能路徑,見上圖。研究人員可以根據金屬陽離子的價態與半徑制定出合適的反應條件。

最後,研究人員設計了三類共20個實驗用以驗證得出的三條化學假設。結果表明,XGBoost具有比研究人員更高的預測準確率。同時發現一個新型金屬有機納米膠囊單晶SCP-4,它是由兩種不同的納米膠囊單元相互連接而成,見上圖。

該研究的意義在於,首次將機器學習算法用於合成製備金屬有機納米膠囊,既可縮減合成反應的數量以減少人力物力的投入,又可深入分析反應條件背後的化學啟示以指導下一步研究方向。該方法還可通過變更機器學習算法的化學特徵以擴展到其他有機無機化合物的合成與發現,同時將機器學習算法與高通量合成也會為化合物的發現與發展帶來無限可能。

https://pubs.acs.org/doi/10.1021/jacs.9b11569

來源:高分子科學前沿

聲明:僅代表作者個人觀點,作者水平有限,如有不科學之處,請在下方留言指正!

關鍵字: