最新消息:雨落星辰是一个专注网站SEO优化、网站SEO诊断、搜索引擎研究、网络营销推广、网站策划运营及站长类的自媒体原创博客

Nat. Methods

网站源码admin2浏览0评论

Nat. Methods

在大数据时代,分子动力学(MD)模拟的使用范式亟需更新。研究人员应以FAIR原则(可查找、可获取、可互操作、可重用)为基础,规范轨迹数据的存储方式,以促进数据的共享与复用,推动开放科学的发展。

结构生物学和基因组学等领域因早期建立数据归档机制,如1971年建立的PDB数据库,已成为当前AI时代的主要受益者。相比之下,分子模拟社区仍沿用几十年前的做法。尽管分子动力学如今被广泛应用于分子机制解析和药物设计,相关模拟数据却常常未被保存,导致后续研究必须重复模拟,既浪费资源,也不利于科研的可持续发展。

随着计算能力提升,研究人员能够模拟更大体系、时间更长的过程,产生海量数据,但相关领域尚缺乏统一的数据存储标准。许多模拟轨迹在论文发表后被删除,无法供他人再分析或进行机器学习训练、力场优化等工作,极大限制了模拟数据的再利用潜力。

为此,研究人员正推动建立可持续的MD数据归档机制。例如,COVID-19疫情期间,Molecular Sciences Software Institute(MolSSI)联合BioExcel、European Open Science Cloud、EBI和Zenodo创建了 COVID-19 Molecular Structure and Therapeutics Hub(),实现了全球范围内的模拟数据共享与联通。

另一个项目 MDverse(/)致力于对散落在网络中的模拟轨迹进行整理、索引与FAIR化。类似的举措正在不断涌现,反映出社区普遍认为应摒弃旧有数据处理方式,构建统一、可复用的数据基础设施。

当前面临的技术挑战(如存储容量、带宽和数据分析能力)可借助分布式数据库体系和高性能计算中心的支持解决。更重要的是,社区应达成共识,制定数据质量标准、压缩策略和元数据规范,包括模拟条件、体系信息、方法参数、数据许可等。最低限度应提供作者、系统构成、模拟设置、模拟目的等基本信息,并采用标准化格式存储轨迹与相关命令、软件版本等数据生成过程。

类似 MDDB 项目(/)正尝试建立标准化的数据归档平台,涵盖数据质量评估、统一格式、元数据要求、访问接口及持久标识符(如DOI)等关键要素。借助这类平台,MD轨迹不仅可以复现,也能够与结构数据、功能注释等生物数据库集成,推动生命科学、药物开发、AI建模等领域的深度融合与知识共享。

研究人员相信,全面拥抱数据驱动的分子模拟范式,将加速科学进步,拓展跨学科合作,为未来科研提供更加坚实的数据基础。

整理 | WJM

参考资料

Amaro, R.E., Åqvist, J., Bahar, I. et al. The need to implement FAIR principles in biomolecular simulations. Nat Methods (2025).

.1038/s41592-025-02635-0

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-06,如有侵权请联系 cloudcommunity@tencent 删除基础数据数据库natmethods

与本文相关的文章

发布评论

评论列表(0)

  1. 暂无评论