人工智能很早就已应用于化合物性质预测。近年来,深度神经网络在该领域的应用展现出了巨大的优势,并频繁出现在各种化合物性质与活性预测挑战赛中。如罗三中基于机器学习方法建立了pKa的全局预测模型。他从iBonD数据库中收集了39种溶剂的pKa实验数据,清洗和整理后得到了包含15338种化合物的数据集。在描述符方面,他们开发了将分子指纹和物理有机参数相结合的SPOC描述符。在建模方面, 他们选择5重交叉验证方法对常用机器学习方法进行了筛选, 发现运用神经网络或XGBoost算法训练的全局模型具有最佳预测表现,MAE 仅为0.87个pK单位。并可以实现多溶剂体系pKa的快速精准预测, 该研究还表明, 全局模型的预测结果优于所有的单一溶剂模型,对不同溶剂中pKa预测值的相关度分析也验证了迁移学习的特征。此外,对样本外药物分子,二甲基亚砜中氢键催化剂以及乙腈中氨基催化剂pKa预测进一步验证了该模型的稳健性。

Jensen等发展了一种分层设计的神经网络模型来预测化学环境(催化剂、溶剂、试剂)和反应温度。该模型对约1000万个来自Reaxys的反应进行了训练, 在训练集以外的100万个反应中进行了测试,以69.6%的准确率预测了排名前十的反应试剂, 以60%~70%的准确率预测了反应温度(±20℃)。未经优化的化学反应在反应时间、试剂方面经常面临低效和成本的问题. 优化反应的一种常用方法是一次改变一个实验条件,同时固定所有其他条件,该方法常会错过最佳条件; 另一种方法是通过组合化学筛选反应条件的所有组合,虽然这种方法有更大可能找到全局最优条件,但是费时费力。因此, 通过机器学习方法构建有效的反应条件优化体系,对学术研究和工业生产都具有重要意义。溶剂选择作为一个独立的问题在早期得到了广泛的研究。