最新消息:雨落星辰是一个专注网站SEO优化、网站SEO诊断、搜索引擎研究、网络营销推广、网站策划运营及站长类的自媒体原创博客

Nat. Commun.

网站源码admin3浏览0评论

Nat. Commun.

DRUGAI

胰腺癌治疗常依赖多药联合方案,但最优组合仍未明确。本研究利用美国国家转化科学促进中心(NCATS)提供的数据,筛选了32种抗癌药物在PANC-1细胞中的496种组合,实验测定其协同或拮抗效应。研究人员(来自NCATS、北卡大学和麻省理工)进一步采用机器学习方法,预测160万种潜在组合中的协同作用。在验证的88组中,51组显示出协同效应,其中图卷积网络命中率最高,随机森林模型精度最佳。本研究不仅展示了机器学习在药物组合筛选中的潜力,还提供了307组经实验验证的协同组合,具有重要的抗胰腺癌应用价值。

胰腺癌具有高度基因组异质性,研究人员已在12个功能通路中发现平均63种基因异常。最常见的类型是胰腺导管腺癌(PDAC),其对系统性治疗的抗性远高于其他实体瘤,治疗效果极差,过去十年预后几乎无改善。药物逐渐失效的主要原因是耐药性增加。因此,开发高效低毒的抗胰腺癌药物成为癌症研究中最具挑战性的任务之一。

多药联合疗法已成为包括疟疾、艾滋病、结核病和多种癌症在内多种疾病的标准治疗策略。联合用药可提高疗效、降低毒性,并延缓耐药性的发展。尽管已有一些成功案例,但更多协同药物组合仍需在临床前阶段筛选。已上市药物因其已知毒性和广泛可获得性,是组合筛选的理想候选。针对胰腺癌的联合疗法有望应对其异质性和适应性,提升治疗效果并克服耐药性。然而,目前针对胰腺癌的药物协同作用研究仍相对有限。

由于潜在药物数量庞大,组合种类成指数增长,且实验验证耗时,因此筛选有效组合仍具挑战。尽管高通量筛选(HTS)技术可用于组合评估,但其效率仍受限。为此,研究人员越来越重视计算方法,作为HTS的有力补充。

QSAR(定量构效关系)是目前广泛应用的计算药物发现方法,通过机器学习等手段建立分子特征与生物活性之间的关系模型。QSAR已广泛用于癌症药物研发,并逐步从单药预测拓展至协同药物组合。近年来,多项研究尝试使用深度学习等方法预测药物协同作用,显示出优于传统模型的效果。一些公开挑战赛和新模型也推动了协同预测的发展,但多数方法依赖特定数据类型,限制了其泛化能力。

本研究由三个研究团队合作开展——包括NCATS、北卡大学和麻省理工学院。NCATS首先筛选出1785种药物中的32种高活性化合物,并对其进行496种两两组合的实验筛查。三组研究人员使用该实验数据训练各自的机器学习模型,从160万种虚拟组合中独立预测出30种最具协同潜力的组合。随后,NCATS对这些预测结果进行实验验证,平均命中率达60%。本研究不仅展示了机器学习在协同药物预测中的实际效力,还发现了307组在PANC-1细胞中表现出协同作用的药物组合,涵盖多种作用机制。研究人员将依次展示数据概况、三组建模结果、预测组合的实验验证以及对最具协同效果组合的机制探索,最后在讨论中总结本研究的计算与实验意义。

研究结果

数据概览

图1展示了本研究的整体流程,结合了计算建模与实验验证。研究人员共提名了88组候选药物组合。研究首先从1785种候选药物中筛选出32种活性化合物(图2a展示其在PANC-1细胞中的剂量反应曲线分布,IC50值介于2 nM至3 µM)。对这32种药物进行两两组合,共产生496种组合,并使用10×10梯度剂量筛选,构建建模数据集。

所有实验重复两次,以评估协同评分的重现性。分析表明,γ分数与其他协同评分一致性最好,因此被选为模型训练的主要指标。训练数据包含平均γ值、SMILES结构、IC50值以及药物作用机制(MoA)。研究聚焦于识别协同组合,不考虑加和效应或拮抗。三组研究人员采用各自的方法开发模型,并以γ < 0.95作为协同阈值。

在1785种药物基础上,理论上可形成1,592,220种组合。除去训练集中已测试的496种组合,测试集中包含剩余的1,591,724种组合。三组研究人员分别从测试集中预测最有潜力的30组协同组合,随后在实验中进行验证。

NCATS建模结果

交叉验证采用“去除一种药物”策略,共32次划分。RF、XGBoost 和 DNN 的整体表现相近,使用 Avalon 或 Morgan 指纹的模型优于使用 RDKit 或内部描述符的模型。最佳模型为使用 Avalon-2048 指纹的RF模型,结合分类与回归,AUC 达到 0.78 ± 0.09(图3),并据此筛选出30组高协同可能性的组合。

UNC建模结果

使用“去除一种药物”和“全部外部”两种策略评估模型表现。“去除一种药物”条件下的分类准确率为 0.6–0.65,阳性预测值为 0.6–0.7;“全部外部”条件下准确率下降至 0.5–0.55。是否纳入IC50值对模型性能影响不显著,不同描述符整合方式(平均或求和)也表现相似。

UNC开发了5个模型(3个描述符模型 + 2个结合IC50的模型),最终组合的提名不仅基于模型排名,还结合了3个补充筛选标准:包括至少有一个药物在训练集中、包含两个活性化合物、以及对应最强协同MoA对。三层筛选共提名30组组合。

MIT建模结果

MIT使用图卷积神经网络进行建模,5次划分的平均AUC为 0.840 ± 0.036。模型从1,591,724种组合中预测协同评分,并从中选择不重复的前30组组合,确保每个药物最多出现5次,以提高组合多样性。

预测结果的实验验证

每个研究团队各自提出30组候选组合,三方结果几乎无重合,表明模型构建过程独立性高。实验验证在PANC-1细胞中进行,重复测试88组独特组合,使用10×10的剂量矩阵评估协同效应(γ < 0.95 判定为协同)。

MIT的图神经网络模型命中率最高,预测成功25/30组(83%);NCATS的RF模型命中16组(53%);UNC模型命中12组(40%)。

在后续对全部88组组合的回顾性分析中,MIT、UNC和NCATS的整体命中率分别为58%、57%和45%。尽管MIT模型AUC最高(0.78),但其假阳性较多。NCATS模型在平衡准确率(BACC=0.59)和精度(0.65)方面表现最佳,假阳性最少。三组模型的联合预测精度未见显著提升。

PANC-1细胞中最强协同药物组合的生物学意义分析

本节从建模转向实验结果分析。在496组训练组合和88组测试组合中,分别有256组和51组的γ值低于0.95,表明存在协同作用(见图5)。这307组协同组合中,多个药物和作用机制(MoA)反复出现。图6显示,Carfilzomib是出现频率最高的药物,并且其参与的组合表现出最强协同效应。

从MoA角度分析,蛋白酶体抑制作用最为常见,其次是PLK1(有丝分裂激酶1)和HDAC(组蛋白去乙酰化酶)抑制。尽管HDAC抑制出现频率略低于PLK1,但其γ评分更优,协同效应更强。

在所有γ < 0.95的协同组合中,有26组的γ值低于0.5,协同作用更为显著。这26组组合涵盖了20种不同的MoA。网络分析(图7)发现,蛋白酶体–HDAC联合抑制是最常见的强协同机制,这一趋势在所有γ < 0.95的协同组合中也同样显著。除了蛋白酶体抑制外,HDAC抑制与突变型p53激活或Survivin抑制的组合也表现出显著协同作用。

研究人员进一步评估了这些MoA–MoA协同关系的统计显著性。蛋白酶体–HDAC联合抑制在307组协同组合中出现9次。为检验其是否为随机现象,研究人员从这307组组合中提取64种独特药物,生成307组随机组合并重复1000次模拟。结果显示该组合在随机情况下平均仅出现4.4次,标准误差为1.9。比较结果表明,实际出现次数显著高于随机预期(P < 0.01),具有统计学意义。

特别值得注意的是,即便使用更严格的协同判定标准(γ < 0.5),蛋白酶体–HDAC依然是最频繁出现的MoA组合(图7),进一步强调了其潜在的生物学价值与临床开发前景。

讨论

本研究针对胰腺癌的复杂性,采用计算与实验结合的方法,系统探索协同药物组合。三家研究机构分别构建机器学习模型,并各自独立筛选出30组候选组合,仅有2组重叠,凸显不同建模策略的互补性。最终,三方模型在PANC-1细胞中分别实现了83%、53%、40%的命中率,所用方法包括图卷积网络(GCN)、结合分类与回归的RF模型,以及多模型整合的定制筛选流程。研究共获得307组经实验验证的协同组合,其中以蛋白酶体抑制,特别是与HDAC抑制联用,最为显著。

尽管MIT和UNC均使用图卷积网络,MIT模型表现更优,可能得益于其引入了来自NCI-ALMANAC的辅助数据(涵盖多种疾病的4000组协同数据)。同时,MIT还通过限制每种药物最多入选5组组合,提升了组合的多样性(图4显示UNC和NCATS中常出现相同的药物反复组合)。这种差异在一定程度上影响了模型性能与泛化能力。

不同模型的表现不仅取决于算法,还受到特征选择与提名策略的影响。NCATS模型命中率高,部分归因于允许重复药物出现,而MIT通过限制提升了多样性。UNC采用三层筛选策略,可能在一定程度上降低了模型的平衡准确率。

本研究的机器学习结果与现有文献在某些方面一致。例如,NCATS比较RF、XGBoost 和 DNN 后发现,特征类型(如Avalon或Morgan指纹)对模型影响更大。与此前研究类似,本研究也证明RF和XGBoost在协同预测中具备优势。但也存在差异,如某些深度学习模型在大数据集上表现优于传统模型,说明具体表现仍受输入特征和任务设置影响。因此,虽然各研究间难以直接对比,但本研究通过在160万组合中的泛化测试,展示了模型在大规模应用中的强大能力。

在实验中,NSC-319726 和 AZD-8055与多种药物组合均表现出协同作用,其中NSC-319726–AZD-8055的γ值为0.78。NSC-319726是突变型p53的激活剂,已被视为胰腺癌的重要靶点;AZD-8055是mTOR抑制剂,已在多种肿瘤中展开研究。然而,mTOR抑制往往诱导自噬,而临床安全剂量的自噬抑制剂(如氯喹)效果有限,提示未来应进一步优化联合策略。

评估药物组合的毒性也至关重要。虽然本研究在PANC-1细胞中获得了协同结果,但尚未在更复杂模型中验证。未来可考虑引入正常细胞系作为对照,或使用来源于患者的类器官、肿瘤球等三维模型,更真实地评估药效和毒性。此外,胰腺癌小鼠模型也可用于进一步验证候选组合在体内的抗肿瘤效果及安全性,为临床转化提供基础。

总之,本研究带来五项重要启示:

  • 机器学习在协同药物预测中表现出强大能力;
  • 即使成本较高,前瞻性实验验证仍是评估模型可靠性的关键;
  • 本研究提供了一个系统评估不同机器学习方法的框架;
  • 多模型协同推进提高了组合发现的广度与准确性;
  • 所发现的药物组合和MoA值得在临床前进一步开发,有望推动胰腺癌新疗法的诞生。

整理 | WJM

参考资料

Pourmousa, M., Jain, S., Barnaeva, E. et al. AI-driven discovery of synergistic drug combinations against pancreatic cancer. Nat Commun 16, 4020 (2025).

.1038/s41467-025-56818-6

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-05-01,如有侵权请联系 cloudcommunity@tencent 删除数据机器学习人工智能nat模型

与本文相关的文章

发布评论

评论列表(0)

  1. 暂无评论