当前基于结构的分子生成面临一个基本困境:虽然静态配体建模主导着计算方法,但现实世界的分子相互作用本质上是动态的。
2026年4月15日,同济大学张艳平和Guang Chen通讯在Science Advances 在线发表题为Steering semi-flexible molecular diffusion model for structure-based drug design with reinforcement learning的研究论文。
该研究提出了一种强化学习(RL)引导的扩散框架,用于蛋白质口袋中的半柔性分子生成。通过将去噪过程定义为马尔可夫决策过程,强化学习通过迭代探索动态调整分子结构。
同时,作者将多种分子性质作为条件纳入,以约束去噪策略至类药物区域,并对无靶标和靶标特异性分子进行自监督的刚性训练。此外,作者提出了一种快速采样策略,将采样速度提高了20倍,从而提高了训练和采样的效率。
实验表明,作者的方法以−7.23 kcal/mol的Vina评分和11.53%的成功率优于现有最先进的方法。针对未见的真实蛋白质,生成的分子保留了典型的相互作用模式,同时发现了先前未知的结合化学型。
基于结构的药物发现(SBDD)正在重塑现代药物开发范式。冷冻电镜单颗粒分析以及人工智能驱动的蛋白质结构预测方法(如AlphaFold)等技术的进步,使得大规模测定蛋白质靶点的高分辨率三维结构成为可能。
这些突破使得能够针对靶点口袋对数百万个化合物进行快速虚拟筛选。然而,虚拟筛选仍然局限于预定义的化学空间,限制了其发现先前未见化学型的能力,特别是对于结构复杂或先前未见过的结合口袋。
为了克服固定化学库的局限性,基于深度学习的生成模型已成为一种强大的替代方案,能够直接根据蛋白质结构条件设计多样化的分子。早期分子生成的探索主要在低维空间中进行,将分子表示为序列或二维图。尽管这些表示允许通过语言模型和图神经网络进行快速采样,但降维伴随着生物物理代价。
由于缺乏三维空间构型,通过这些模型生成的分子可能无法满足实际应用中的稳定性和活性要求。三维几何深度学习的出现缓解了这一维度障碍,其对特殊欧几里得群SE(3)保持等变的架构使得能够利用三维结构信息对分子进行精确建模,并从头生成具有高空间保真度的三维分子结构。
最近基于结构的分子生成(SBMG)研究已将蛋白质-配体复合物整合到三维生成架构中。当前的SBMG模型主要采用两种范式:自回归生成和一步生成。自回归方法逐步生成分子结构,捕捉分子序列的复杂性和依赖性。例如,AR使用蛋白质口袋作为三维上下文来估计空间中原子的概率密度,并从学习到的分布中顺序采样原子。
Pocket2Mol和ResGen使用等变GNN学习蛋白质口袋施加的化学和几何约束,考虑原子和键信息,并以自回归方式生成分子。由于逐个原子生成效率低下且存在生成不现实结构的风险,FLAG通过不变GNN学习蛋白质-配体复合物的几何结构,并引入片段先验,在片段水平进行自回归采样。然而,自回归方法由于固有的顺序性质而遭受误差积累和结构有效性有限的问题。
SeFMol框架概述(图片源自Science Advances)
相比之下,一步生成模型提供了更高的训练效率和整体建模全局结构的能力。这些模型模拟分子在三维空间中从无序到有序的转变。最近基于扩散的SBMG模型,如TargetDiff、DecompDiff和IPDIFF,学习原子类型和坐标的联合分布,而MolCRAFT在连续参数空间中对它们进行建模。
这些方法基于蛋白质口袋在连续三维空间中生成分子,并实现了对口袋-配体复合物全局平移和旋转的不变似然。尽管取得了这些进展,大多数SBMG模型假设配体构象是刚性的。因此,动态耦合效应常常被忽略,限制了模型为新靶点生成高质量配体的能力。
此外,现有方法受限于受体-配体复合物数据的质量和数量,仅专注于生成高亲和力分子,忽视了多分子性质优化所需的协调性。因此,生成的分子往往无法超越训练集的质量边界。
为了解决这些局限性,作者引入了SeFMol,一个由强化学习(RL)引导的半柔性分子扩散模型。受半柔性对接范式的启发,SeFMol在训练期间允许构象调整以更好地适应结合位点。该过程模拟了半柔性对接中常用的有限自由度优化,以探索固定蛋白质的低能姿态。
具体而言,作者将扩散的去噪阶段表述为马尔可夫决策过程(MDP),允许强化学习根据口袋几何和性质条件引导分子的结构演化。作者以多个分子性质为条件进行生成,并利用无靶标和靶标特异性训练来增强性质可控性和靶标特异性。此外,作者引入了一种可变快速采样策略,将采样步骤减少了20倍(从1000步减少到50步),显著提高了训练和推理效率。
作者进行了全面的实验来验证SeFMol的通用性和有效性。作者的评估涵盖了对接性能、类药物性质、相互作用模式、构象质量、新颖性和采样效率。最后,作者展示了SeFMol对真实世界治疗靶点的泛化能力,突显了其作为基于结构的药物设计稳健框架的潜力。
原文链接:https://www.science.org/doi/10.1126/sciadv.ady9955