MultiMol:协作式专家智能体驱动的药物分子多目标优化
在药物研发中,分子优化是连接基础研究与临床应用的关键环节。理想的药物分子需同时具备高效活性、良好稳定性、低毒性等多重特性。然而,这些性质之间往往存在相互制约的关系,使得优化过程异常复杂。传统方法依赖专家经验和反复试错,耗时长且失败率高,而现有的人工智能(AI)技术在多目标优化场景下仍面临生成分子有效性不足和骨架保留能力有限的挑战。
近日,来自浙大的研究团队提出了一个名为 MultiMol 的协作式大语言模型系统,通过双智能体协同工作显著提升了多目标分子优化的性能。
药物分子优化的核心挑战
药物分子优化旨在从初始“命中化合物”出发,通过结构调整使其满足临床所需的多种药理特性。然而,这一过程常被称为“不可能三角”,原因在于分子性质之间的相互依赖性。例如,提升水溶性可能降低膜渗透性,而增强活性可能增加毒性风险。传统优化依赖人工试错,临床候选药物失败率高达90%。近年来,AI 技术虽在分子生成方面取得进展,但现有模型在多目标场景下仍存在以下痛点:
- 多目标平衡难题:难以兼顾冲突性质,如溶解性与结合亲和力。
- 化学有效性不足:生成分子常因缺乏化学合理性而无法合成。
- 骨架破坏问题:优化过程易偏离原始分子的核心结构(Scaffold),降低结果的实用性。
- 知识断层:缺乏文献中的先验知识引导,生成结果与实际药物设计需求脱节。
MultiMol 的技术框架:双智能体协作模式
为应对上述挑战,MultiMol 系统引入了创新的双智能体协作框架,将数据驱动生成与知识引导筛选深度融合。
具体而言,该系统由以下两个核心组件构成:
1. 数据驱动工人智能体(Worker Agent)
- 技术基础:基于百万级分子库(如 PubChem)对大语言模型(如 Galactica-6.7B)进行微调。
- 训练策略:采用“掩码-重建”方法,即输入分子骨架和目标性质(如“降低 LogP”),由模型重建满足条件的完整分子结构。
- 独特优势:无需依赖分子对数据即可生成候选分子,显著提升了多目标约束下的生成效率。
2. 文献指导研究智能体(Research Agent)
- 知识来源:利用 GPT-4o 等模型检索文献,提取与优化目标相关的化学规律(如“亲水基团可提升溶解度”)。
- 筛选机制:构建线性评分函数,对工人智能体生成的候选分子进行评估,筛选出最优解。
- 实例应用:在优化水溶性任务中,研究智能体自动识别并应用“引入 -NH2 基团降低 LogP”的规则。
通过双智能体协作,MultiMol 不仅能生成多样化的候选分子,还能确保结果在化学上合理并贴近实际需求。这种模式有效弥补了单一数据驱动模型的不足。
性能评估
研究团队在六项多目标优化任务和八项单目标优化任务中对 MultiMol 进行了全面测试,涵盖提升水溶性、增强选择性、优化生物利用度等场景。结果显示,MultiMol 在多项关键指标上领先现有最优模型:
指标 | MultiMol | 现有最优模型 |
---|---|---|
多目标成功率(严格) | 66.49% | 10%-27.50% |
分子有效性 | 98.3% | <90% |
骨架保留率 | 95.4% | <70% |
单目标宽松命中率 | 90.92% | 未达标 |
典型案例分析
- XAC 选择性优化
- 任务:提升非选择性腺苷受体拮抗剂 Xanthine amine congener(XAC)对 A1R 的选择性,同时降低对 A2AR 的亲和力。
- 方法:工人智能体生成候选分子,研究智能体识别并引入大体积疏水基团,靶向 A1R 受体特异性残基 T270。
- 结果:结合能差异(ΔG)从 0.05 kcal/mol 提升至 1.85 kcal/mol,选择性显著增强。
- Saquinavir 生物利用度改进
- 任务:优化 HIV 蛋白酶抑制剂 Saquinavir 的水溶性,同时维持其与 HIV-1 蛋白酶的结合亲和力。
- 方法:通过添加 -NH2 等亲水基团调整结构。
- 结果:LogP 从 3.09 降至 2.67,水溶性提升,结合亲和力同步增强。
这些案例表明,MultiMol 能在复杂多目标场景中实现精准优化,同时保持分子结构的化学合理性。
局限性与改进方向
尽管 MultiMol 表现优异,但其仍面临一些挑战:
- 数据依赖性:模型的创新性受限于训练数据分布,难以探索全新化学空间。
- 机理推理不足:缺乏对化学反应机理的深层理解,部分优化依赖试探性生成而非理论推导。
- 扩展性需求:当前系统专注于活性与物化性质优化,尚未覆盖毒性预测或合成可行性评估。
未来改进方向包括:
- 集成更大数据集和先进模型架构以提升生成多样性。
- 引入专业智能体(如毒性预测模块)扩展应用场景。
- 结合蛋白质结构预测工具(如 AlphaFold),进一步优化结合亲和力预测的精确性。
结语
MultiMol 通过双智能体协作模式,将数据驱动的分子生成与文献知识的智能筛选相结合,尝试突破多目标分子优化的传统瓶颈。其在实验中的表现证明了这一范式的潜力,为 AI 驱动的药物设计开辟了新路径。尽管存在局限性,但其开放性和扩展性为未来的技术迭代奠定了基础。展望未来,若能进一步整合蛋白质结构预测等工具,MultiMol 或将在药物研发领域发挥更大作用。
参考
- 参考文献
- Yu, J., Zheng, Y., Koh, H.Y., Pan, S., Wang, T. and Wang, H., 2025. Collaborative Expert LLMs Guided Multi-Objective Molecular Optimization. arXiv preprint arXiv:2503.03503.
- .48550/arXiv.2503.03503
- 代码
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-12,如有侵权请联系 cloudcommunity@tencent 删除系统优化基础模型数据本文为BioAI实验盒对论文的学术分析、阐释及个人观点的呈现。原论文的版权归属于原作者,并遵循其版权协议。本文的解读部分内容由BioAI实验盒撰写,如需转载,请提前通过私信联系。