TUM团队发布ConSolv模型:一个隐式溶剂MLP覆盖66种有机溶剂
B910化工消息:6月23日消息,arXiv新提交论文显示,慕尼黑工业大学TUM School of Engineering and Design的Linying Zhang和Julija Zavadlav提出ConSolv,一种“溶剂条件化”的隐式溶剂机器学习势,用于在分子动力学中同时表达溶质结构和非水有机溶剂效应。论文提交时间为2026年6月23日13:59 UTC,作者机构包括TUM工程物理与计算系Multiscale Modeling of Fluid Materials团队,以及TUM Munich Data Science Institute的Atomistic Modeling Center。
传统分子模拟在溶剂处理上面临速度与精度权衡:显式溶剂模型可解析分子相互作用,但计算成本高;连续介质或半经验隐式模型速度快,却常难以覆盖有机合成、药物分子和电池电解液中大量非水溶剂。ConSolv的设计思路是把溶剂描述符通过attention-based solvent-embedding block注入到溶质相互作用中,让一个模型同时学习多种溶剂对同一溶质的影响,而不是为每一种溶剂单独建模。
论文给出了明确训练与测试数据。第一阶段使用过滤后的SPICE数据集,原始数据包含超过10^5个分子体系和超过2×10^6个构象;模型覆盖H、C、N、O、F、P、S、Cl、Br、I等元素。第二阶段使用Solv@TUM实验溶剂化自由能数据库,原库含5952个中性分子数据点、覆盖146种非水溶剂;作者筛选出每种溶剂超过30个溶质数据点的66种溶剂,形成4577个溶质-溶剂对。
性能方面,ConSolv在Solv@TUM测试集923个点上RMSE为0.64 kcal/mol、MAE为0.50 kcal/mol、总体R2为0.97,超过92%的预测落在实验值1 kcal/mol以内。在Zhang等人的基准测试中,ConSolv的RMSE为0.82 kcal/mol、MAE为0.68 kcal/mol、R2为0.93,优于显式溶剂经典力场GAFF的1.18、0.87和0.85。模型还在氯仿中γ-fluorohydrin分子的NMR相关测试中与实验结果接近。对化学产业链而言,这类模型若能扩展到更复杂反应中间体、电解液盐和药物候选物,可能降低溶剂筛选、溶解度预测和配方前期模拟的计算门槛。 (来源:arXiv)
传统分子模拟在溶剂处理上面临速度与精度权衡:显式溶剂模型可解析分子相互作用,但计算成本高;连续介质或半经验隐式模型速度快,却常难以覆盖有机合成、药物分子和电池电解液中大量非水溶剂。ConSolv的设计思路是把溶剂描述符通过attention-based solvent-embedding block注入到溶质相互作用中,让一个模型同时学习多种溶剂对同一溶质的影响,而不是为每一种溶剂单独建模。
论文给出了明确训练与测试数据。第一阶段使用过滤后的SPICE数据集,原始数据包含超过10^5个分子体系和超过2×10^6个构象;模型覆盖H、C、N、O、F、P、S、Cl、Br、I等元素。第二阶段使用Solv@TUM实验溶剂化自由能数据库,原库含5952个中性分子数据点、覆盖146种非水溶剂;作者筛选出每种溶剂超过30个溶质数据点的66种溶剂,形成4577个溶质-溶剂对。
性能方面,ConSolv在Solv@TUM测试集923个点上RMSE为0.64 kcal/mol、MAE为0.50 kcal/mol、总体R2为0.97,超过92%的预测落在实验值1 kcal/mol以内。在Zhang等人的基准测试中,ConSolv的RMSE为0.82 kcal/mol、MAE为0.68 kcal/mol、R2为0.93,优于显式溶剂经典力场GAFF的1.18、0.87和0.85。模型还在氯仿中γ-fluorohydrin分子的NMR相关测试中与实验结果接近。对化学产业链而言,这类模型若能扩展到更复杂反应中间体、电解液盐和药物候选物,可能降低溶剂筛选、溶解度预测和配方前期模拟的计算门槛。 (来源:arXiv)

