祝贺课题组硕士研究生吴婷在化工领域顶级期刊《AIChE Journal》上发表最新研究成果
点击次数:

近日,课题组在低共熔溶剂(DES)物性预测与人工智能建模交叉领域研究取得重要突破,构建了一种融合图神经网络(MPNN-GAT)与多层感知机(MLP)的多尺度黏度预测模型,在不依赖实验测量的条件下,实现了DES黏度的高精度预测(R²=0.9945,AARD=2.69%),在模型准确性、通用性与可解释性方面均取得显著提升。该研究成果以“Multiscale exploration of informative latent features for accurate deep eutectic solvents viscosity prediction”为题发表在化工领域顶级期刊《AIChE Journal》上。
【论文解读】
1. 研究背景:高黏度成绿色溶剂“卡点”
DES因其合成简便、低毒、可再生、生物可降解等优点,被誉为“下一代绿色溶剂”,广泛应用于提取、分离、电化学与催化等场景。然而,DES的高黏度强烈影响其在化学反应和分离的传质过程。对于不计其数的可设计溶剂而言,纯粹靠实验测量来确定其黏度在经济和技术上都是不合理的。传统黏度预测方法如Arrhenius模型、分子动力学模拟存在建模复杂、参数依赖强等局限,亟需一种如图1能够端到端处理、自动学习分子特征的机器学习框架。

图1 端到端预测DES黏度的机器学习框架图
2. 研究思路:“结构+性质”多尺度融合模型架构
该研究首次构建了一种融合分子结构图学习、宏观物性输入与解释性分析的AI建模框架如图2所示。

图2 模型框架结构图
核心包括以下三层设计:
(1)分子结构编码
利用SMILES表达式生成分子图,引入消息传递神经网络(MPNN)与图注意力机制(GAT),自动学习原子之间的连接方式、键类型和局部拓扑信息,提取关键子结构特征。
(2)宏观物性融合
在模型输入中,特别引入了预测得到的密度特征,以捕捉分子混合后的整体行为特性。关于密度的预测,该作者团队此前发表于《Computers & Chemical Engineering》的研究成果“ChemBERTa embeddings and ensemble learning for prediction of density and melting point of deep eutectic solvents with hybrid features”,采用ChemBERTa嵌入结合集成学习方法对DES密度与熔点进行建模,可以为本研究提供技术支撑。
(3)多层感知回归网络
使用多层感知机(MLP)对结构特征与物性特征进行融合回归,最终输出黏度预测值。该模型结构避免了传统方法对人工特征工程的依赖,具有更强的泛化与迁移能力。
在涵盖5790组不同温度、不同类型DES的实验数据集上,所提模型展现出极高的预测精度:决定系数R²=0.9945,平均相对误差AARD=2.69%,显著优于对比模型(如XGBoost、SVR、RF等)。如图3所示,尤其在极高黏度区间和边界温度条件下,模型仍保持良好的稳定性与准确性。

图3 DES黏度预测的残差和误差分析。(A)不同DES类型和黏度范围的残差分布。(B)不同DES黏度范围的黏度预测残差分布。(C)不同温度条件下的黏度预测残差分布。(D)不同DES类型的预测误差箱线图。(E)不同黏度范围的预测误差箱线图。(F)不同温度区间的预测误差箱线图。
3. 模型解释能力:从“黑箱”到“可解释”
为增强模型透明性,研究引入SHAP值分析方法,量化不同分子特征对黏度预测的贡献度如图4所示。结果显示:极性相关官能团(如-OH、-COOH)、分子间氢键作用强度、密度与温度协同效应是影响DES黏度的主要因素。

图4 在不包含图特征的MPNN-GAT-MLP模型中对关键特征贡献和影响的SHAP分析。(A)特征贡献图:关键特征在MPNN-GAT-MLP模型预测中的重要性。(B)SHAP蜜蜂群图:主要特征对MPNN-GAT-MLP模型预测的影响分布。
4. 小结与展望
该研究以AI模型为桥梁,打通了从分子结构理解到宏观性能预测的多尺度通道,为绿色溶剂体系的定向设计、快速筛选与工业推广提供了新路径。未来,该模型框架有望推广至其他关键物性(如表面张力、电导率等),推动绿色化工从经验驱动走向数据驱动与智能决策。
第一作者:

吴婷,广东工业大学轻工化工学院2023级化学工程专业硕士研究生,师从林晓清教授。2019-2023年于广东工业大学获得化学工程与工艺学士学位。研究方向:低共熔溶剂智能筛选与设计研究。以第一作者在AIChE Journal, Computers & Chemical Engineering发表SCI论文2篇。链接:https://github.com/tingtingwuwu
【致谢】
本项目获得以下资助支持:国家自然科学基金(21978053,51508547),国家重点研发计划(2023YFB4203603),广东省重点领域研发项目(2020B0101070001)。
原文链接:
Multiscale exploration of informative latent features for accurate deep eutectic solvents viscosity prediction
https://aiche.onlinelibrary.wiley.com/doi/full/10.1002/aic.18924
ChemBERTa embeddings and ensemble learning for prediction of density and melting point of deep eutectic solvents with hybrid features
