BIGDATA: IA: Collaborative Research: In Situ Data Analytics for Next Generation Molecular Dynamics Workflows

BIGDATA:IA:协作研究:下一代分子动力学工作流程的原位数据分析

基本信息

  • 批准号:
    1841758
  • 负责人:
  • 金额:
    $ 98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-06-01 至 2023-09-30
  • 项目状态:
    已结题

项目摘要

Molecular dynamics simulations studying the classical time evolution of a molecular system at atomic resolution are widely recognized in the fields of chemistry, material sciences, molecular biology and drug design; these simulations are one of the most common simulations on supercomputers. Next-generation supercomputers will have dramatically higher performance than do current systems, generating more data that needs to be analyzed (i.e., in terms of number and length of molecular dynamics trajectories). The coordination of data generation and analysis cannot rely on manual, centralized approaches as it does now. This interdisciplinary project integrates research from various areas across programs such as computer science, structural molecular biosciences, and high performance computing to transform the centralized nature of the molecular dynamics analysis into a distributed approach that is predominantly performed in situ. Specifically, this effort combines machine learning and data analytics approaches, workflow management methods, and high performance computing techniques to analyze molecular dynamics data as it is generated, save to disk only what is really needed for future analysis, and annotate molecular dynamics trajectories to drive the next steps in increasingly complex simulations' workflows. The investigators tackle the data challenge of data analysis of molecular dynamics simulations on the next-generation supercomputers by (1) creating new in situ methods to trace molecular events such as conformational changes, phase transitions, or binding events in molecular dynamics simulations at runtime by locally reducing knowledge on high-dimensional molecular organization into a set of relevant structural molecular properties; (2) designing new data representations and extend unsupervised machine learning techniques to accurately and efficiently build an explicit global organization of structural and temporal molecular properties; (3) integrating simulation and analytics into complex workflows for runtime detection of changes in structural and temporal molecular properties; and (4) developing new curriculum material, online courses, and online training material targeting data analytics. The project's harnessed knowledge of molecular structures' transformations at runtime can be used to steer simulations to more promising areas of the simulation space, identify the data that should be written to congested parallel file systems, and index generated data for retrieval and post-simulation analysis. Supported by this knowledge, molecular dynamics workflows such as replica exchange simulations, Markov state models, and the string method with swarms of trajectories can be executed ?from the outside? (i.e., without reengineering the molecular dynamics code).
以原子分辨率研究分子系统经典时间演化的分子动力学模拟在化学、材料科学、分子生物学和药物设计领域得到广泛认可;这些模拟是超级计算机上最常见的模拟之一。 下一代超级计算机将比当前系统具有更高的性能,生成更多需要分析的数据(即分子动力学轨迹的数量和长度)。数据生成和分析的协调不能像现在那样依赖手动、集中的方法。 这个跨学科项目整合了计算机科学、结构分子生物科学和高性能计算等各个领域的研究,将分子动力学分析的集中式性质转变为主要在原位进行的分布式方法。具体来说,这项工作结合了机器学习和数据分析方法、工作流程管理方法和高性能计算技术来分析生成的分子动力学数据,仅将未来分析真正需要的数据保存到磁盘,并注释分子动力学轨迹以驱动日益复杂的模拟工作流程的后续步骤。研究人员通过以下方式解决下一代超级计算机上分子动力学模拟数据分析的数据挑战:(1)创建新的原位方法来跟踪运行时分子动力学模拟中的构象变化、相变或结合事件等分子事件将高维分子组织的知识局部还原为一组相关的结构分子特性; (2)设计新的数据表示并扩展无监督机器学习技术,以准确有效地构建结构和时间分子属性的明确全局组织; (3) 将模拟和分析集成到复杂的工作流程中,以便运行时检测结构和时间分子特性的变化; (4) 开发针对数据分析的新课程材料、在线课程和在线培训材料。该项目利用了运行时分子结构转换的知识,可用于将模拟引导到模拟空间中更有前途的区域,识别应写入拥塞并行文件系统的数据,以及索引生成的数据以进行检索和模拟后分析。在这些知识的支持下,可以“从外部”执行分子动力学工作流程,例如副本交换模拟、马尔可夫状态模型和具有轨迹群的弦方法。 (即,无需重新设计分子动力学代码)。

项目成果

期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Characterizing In Situ and In Transit Analytics of Molecular Dynamics Simulations for Next-Generation Supercomputers
表征下一代超级计算机分子动力学模拟的原位和传输分析
  • DOI:
    10.1109/escience.2019.00027
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Taufer, Michela;Thomas, Stephen;Wyatt, Michael;Anh Do, Tu Mai;Pottier, Loic;da Silva, Rafael Ferreira;Weinstein, Harel;Cuendet, Michel A.;Estrada, Trilce;Deelman, Ewa
  • 通讯作者:
    Deelman, Ewa
Adaptive Sampling using a Geometric Brownian Motion Model to Predict MD Trajectory Mobility on a Free Energy Surface
使用几何布朗运动模型的自适应采样来预测自由能表面上的 MD 轨迹迁移率
  • DOI:
    10.1016/j.bpj.2020.11.690
  • 发表时间:
    2021-02
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Kots, Ekaterina D.;Shore, Derek M.;Weinstein, Harel
  • 通讯作者:
    Weinstein, Harel
Assessing Resource Provisioning and Allocation of Ensembles of In Situ Workflows
评估现场工作流程整体的资源供应和分配
A lightweight method for evaluating in situ workflow efficiency
一种评估现场工作流程效率的轻量级方法
  • DOI:
    10.1016/j.jocs.2020.101259
  • 发表时间:
    2021-01
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Do, Tu Mai;Pottier, Loïc;Caíno;Ferreira da Silva, Rafael;Cuendet, Michel A.;Weinstein, Harel;Estrada, Trilce;Taufer, Michela;Deelman, Ewa
  • 通讯作者:
    Deelman, Ewa
Graphic Encoding of Macromolecules for Efficient High-Throughput Analysis
用于高效高通量分析的大分子图形编码
  • DOI:
    10.1145/3233547.3233607
  • 发表时间:
    2018-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Estrada, Trilce;Benson, Jeremy;Carrillo;Razavi, Asghar M.;Cuendet, Michel A.;Weinstein, Harel;Deelman, Ewa;Taufer, Michela
  • 通讯作者:
    Taufer, Michela
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michela Taufer其他文献

Scalable Incremental Checkpointing using GPU-Accelerated De-Duplication
Integrating FAIR Digital Objects (FDOs) into the National Science Data Fabric (NSDF) to Revolutionize Dataflows for Scientific Discovery
将 FAIR 数字对象 (FDO) 集成到国家科学数据结构 (NSDF) 中,彻底改变科学发现的数据流
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michela Taufer;Heberth Martinez;Jakob Luettgau;Lauren Whitnah;†. GiorgioScorzelli;†. PaniaNewel;Aashish Panta;Timo Bremer;§. DougFils;¶. ChristineR.Kirkpatrick;Nina McCurdy;V. Pascucci;U. Knoxville;†. U.Utah;R. LLNL ‡;Research Center
  • 通讯作者:
    Research Center
Computational multiscale modeling in protein--ligand docking
蛋白质-配体对接的计算多尺度建模
NSDF-Services: Integrating Networking, Storage, and Computing Services into a Testbed for Democratization of Data Delivery
NSDF 服务:将网络、存储和计算服务集成到数据交付民主化的测试平台中
Special issue of computer communications on information and future communication security
计算机通信信息与未来通信安全专刊
  • DOI:
    10.1016/j.comcom.2010.10.008
  • 发表时间:
    2011-03-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jong Hyuk Park;Sheikh Iqbal Ahamed;Willy Susilo;Michela Taufer
  • 通讯作者:
    Michela Taufer

Michela Taufer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michela Taufer', 18)}}的其他基金

EAGER: A Comprehensive Approach for Generating, Sharing, Searching, and Using High-Resolution Terrain Parameters
EAGER:生成、共享、搜索和使用高分辨率地形参数的综合方法
  • 批准号:
    2334945
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Model-driven Design and Optimization of Dataflows for Scientific Applications
协作研究:SHF:小型:科学应用数据流的模型驱动设计和优化
  • 批准号:
    2331152
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
SHF: Small: Methods, Workflows, and Data Commons for Reducing Training Costs in Neural Architecture Search on High-Performance Computing Platforms
SHF:小型:降低高性能计算平台上神经架构搜索训练成本的方法、工作流程和数据共享
  • 批准号:
    2223704
  • 财政年份:
    2022
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: SENSORY: Software Ecosystem for kNowledge diScOveRY - a data-driven framework for soil moisture applications
协作研究:要素:SENSORY:知识发现的软件生态系统 - 土壤湿度应用的数据驱动框架
  • 批准号:
    2103845
  • 财政年份:
    2021
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: SENSORY: Software Ecosystem for kNowledge diScOveRY - a data-driven framework for soil moisture applications
协作研究:要素:SENSORY:知识发现的软件生态系统 - 土壤湿度应用的数据驱动框架
  • 批准号:
    2103845
  • 财政年份:
    2021
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Advancing Reproducibility in Multi-Messenger Astrophysics
合作研究:EAGER:提高多信使天体物理学的可重复性
  • 批准号:
    2041977
  • 财政年份:
    2020
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: Planning: Performance Scalability, Trust, and Reproducibility: A Community Roadmap to Robust Science in High-throughput Applications
协作研究:PPoSS:规划:性能可扩展性、信任和可重复性:高通量应用中稳健科学的社区路线图
  • 批准号:
    2028923
  • 财政年份:
    2020
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
SHF: Medium: Collaborative Research: ANACIN-X: Analysis and modeling of Nondeterminism and Associated Costs in eXtreme scale applications
SHF:中:协作研究:ANACIN-X:极端规模应用中的非确定性和相关成本的分析和建模
  • 批准号:
    1900888
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Continuing Grant
SHF:Medium:Collaborative Research:A comprehensive methodology to pursue reproducible accuracy in ensemble scientific simulations on multi- and many-core platforms
SHF:中:协作研究:在多核和众核平台上追求集合科学模拟的可重复精度的综合方法
  • 批准号:
    1841552
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative: EAGER: Exploring and Advancing the State of the Art in Robust Science in Gravitational Wave Physics
合作:EAGER:探索和推进引力波物理学稳健科学的最新技术
  • 批准号:
    1823372
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant

相似国自然基金

甘蓝型油菜BnaA01.IA调控花序结构的分子机制解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
Ia型超新星抛射物元素丰度与时域观测特征相关性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
年轻Ia型超新星遗迹在湍动背景场中的数值模拟研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大豆GmCPSF73-Ia调控侧根发育的分子机制
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
核因子IA通过调节破骨细胞分化影响骨稳态和骨量的作用及其机制研究
  • 批准号:
    82072389
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
  • 批准号:
    1838024
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    1947584
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了