J. Hazard. Mater.
DRUGAI
药物诱导的骨毒性是药物研发、临床实践和环境管理中的重要安全风险。然而,目前缺乏针对骨毒性的专用数据集和有效预测算法,导致骨毒性风险评估面临挑战。
2025年3月,吉林大学生命科学学院韩葳葳教授团队在国际著名期刊《Journal of Hazardous Materials》(环境科学与生态学1区Top,IF=12.2)上发表题为《Unveiling drug-induced osteotoxicity: A machine learning approach and webserver》的研究成果。
如图1所示,本研究开发了一种名为BoneToxPD的药物骨毒性预测平台。首先,通过FDA、DrugBank、SIDER和CTD数据库,收集药物相关信息,建立骨毒性数据集。随后,利用聚类分析和理化性质分析,并借助SwissTargetPrediction、GeneOntology与KEGG数据库进一步进行药物的机制分析。在此基础上,提取多种药物分子特征,包括分子指纹(如MACCS、Morgan、RDKit、TopologicalTorsion、AtomPairs与Descriptors)及分子图谱,通过Transformer编码器与神经网络进行机器学习模型训练。最后,将训练好的模型部署为在线Web服务器(BoneToxPD),供用户快速预测药物的骨毒性。
图 1 工作流程
作者团队通过收集大量具有骨毒性的化合物数据,进行分子聚类分析,将化合物分为四个显著群组。随后采用靶标预测方法,发现关键基因IL6、TNF、ESR1和MAPK3参与骨毒性的分子机制。此外,利用GO和KEGG富集分析,探索了骨毒性复杂的生物学路径和分子功能。
图 2 数据集特征及聚类结果
基于分子指纹和描述符,团队训练了多个预测模型包括Transformer、SVM、XGBoost以及GNN、视觉Transformer (ViT) ,并微调了预训练模型KPGT。其中,描述符-Transformer模型和KPGT模型表现最优,预测准确率达到86%,AUC达到89%。
图3 模型表现
为便于药物研发和安全性评估,作者进一步推出了首个专门用于预测药物骨毒性的在线平台——BoneToxPD。该平台提供实时高效的骨毒性预测服务,并能直观展示影响预测结果的关键分子描述符,帮助研究人员迅速识别和降低药物骨毒性风险。
图 4 在线平台BoneToxPD使用流程
本研究不仅在骨毒性预测的准确性方面取得了突破,还在模型解释性方面提供了新的视角,通过注意力机制精准识别出影响骨毒性的关键化学基团,推动药物研发领域更安全、更高效的发展。
吉林大学生命科学学院2023级硕士研究生崔慧子,2024级博士研究生贺奕及2021级本科生王志邦为本文共同作者,韩葳葳教授和李婉南副教授为本文通讯作者。研究得到了国家自然科学基金(No.32471313)资助支持。
参考资料
Cui H, He Y, Wang Z, Liu K, Li W, Han W. Unveiling drug-induced osteotoxicity: A machine learning approach and webserver. J Hazard Mater. 2025 Mar 28;492:138044.
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-01,如有侵权请联系 cloudcommunity@tencent 删除模型数据研发机器学习安全