Elements: Adaptive End-to-End Parallelism for Distributed Science Workflows

要素:分布式科学工作流程的自适应端到端并行性

基本信息

项目摘要

Technological advancements in sensing and computing technologies have led to an unprecedented increase in the amount of data generated by scientific applications. As science projects are increasingly distributed in nature, the increase in data sizes in turn results in an increased volume of traffic that needs to be moved across geographically distributed locations. Although significant investments have been made to build high-speed networks to facilitate data movements between research and education institutions, it is difficult for domain scientists to efficiently utilize this available capacity mainly due to the lack of scalable data transfer services. This project addresses this need by developing a scalable and reliable data transfer service. It further integrates the data transfer service into elastic workflow management systems to achieve end-to-end optimization for distributed science workflows. This project makes three novel contributions to the field: (i) it innovates scalable integrity verification and encryption for file transfers to ensure the reliability of file transfers without sacrificing performance. It takes advantage of computing resources available at data transfer nodes to scale the performance of integrity verification and channel encryption features. (ii) It innovates end-to-end parallelism for distributed workflows by integrating an online transfer optimization service into elastic workflow management tools. Unlike existing workflow management solutions, which merely focus on the optimization of computing tasks, the proposed integration of online transfer optimization services into elastic workflow schedulers enables true end-to-end parallelism for distributed workflows. (iii) Finally, it demonstrates the performance of the developed service on a real-world bioscience workflow that streams a large volume of sequence read archive data from the NCBI database to extract computation-ready SAM/BAM files.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
传感和计算技术的进步导致科学应用产生的数据量空前增加。随着科学项目在本质上越来越分散,数据大小的增加反过来导致需要在地理分布的位置之间移动的流量增加。尽管已经投入了大量资金来建设高速网络以促进研究和教育机构之间的数据传输,但由于缺乏可扩展的数据传输服务,领域科学家很难有效地利用这种可用容量。该项目通过开发可扩展且可靠的数据传输服务来满足这一需求。它将数据传输服务进一步集成到弹性工作流管理系统中,以实现分布式科学工作流的端到端优化。该项目对该领域做出了三项新颖的贡献:(i)创新了文件传输的可扩展完整性验证和加密,以确保文件传输的可靠性而不牺牲性能。它利用数据传输节点上可用的计算资源来扩展完整性验证和通道加密功能的性能。 (ii) 通过将在线传输优化服务集成到弹性工作流管理工具中,创新了分布式工作流的端到端并行性。与仅关注计算任务优化的现有工作流管理解决方案不同,拟议将在线传输优化服务集成到弹性工作流调度程序中,为分布式工作流实现真正的端到端并行性。 (iii) 最后,它展示了所开发的服务在现实世界生物科学工作流程中的性能,该工作流程从 NCBI 数据库传输大量序列读取存档数据以提取可计算的 SAM/BAM 文件。该奖项反映了 NSF 的法定使命通过使用基金会的智力优点和更广泛的影响审查标准进行评估,并被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Falcon: Fair and Efficient Online File Transfer Optimization
Falcon:公平高效的在线文件传输优化
Use Only What You Need: Judicious Parallelism For File Transfers in High Performance Networks
仅使用您需要的:高性能网络中文件传输的明智并行性
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Engin Arslan其他文献

Scalable Quantum Repeater Deployment Modeling
可扩展的量子中继器部署建模
  • DOI:
    10.48550/arxiv.2305.09855
  • 发表时间:
    2023-05-16
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    Tasdiqul Islam;Engin Arslan
  • 通讯作者:
    Engin Arslan
Reliable Wide-Area Data Transfers for Streaming Workflows
适用于流式工作流程的可靠广域数据传输
Application-Level Optimization of Big Data Transfers through Pipelining, Parallelism and Concurrency
通过管道、并行性和并发性对大数据传输进行应用级优化
  • DOI:
    10.1109/tcc.2015.2415804
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    6.5
  • 作者:
    E. Yildirim;Engin Arslan;Jangyoung Kim;T. Kosar
  • 通讯作者:
    T. Kosar
Deep learning for the security of software-defined networks: a review
软件定义网络安全的深度学习:综述
  • DOI:
    10.1007/s10586-023-04069-9
  • 发表时间:
    2023-07-15
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Roya Taheri;Habib Ahmed;Engin Arslan
  • 通讯作者:
    Engin Arslan
RIVAChain: Blockchain-based Integrity Verification for File Transfers

Engin Arslan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Engin Arslan', 18)}}的其他基金

Elements: Adaptive End-to-End Parallelism for Distributed Science Workflows
要素:分布式科学工作流程的自适应端到端并行性
  • 批准号:
    2427408
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CAREER: Efficient and Reliable Data Transfer Services for Next Generation Research Networks
职业:为下一代研究网络提供高效可靠的数据传输服务
  • 批准号:
    2348281
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Collaborative Research: OAC Core: Small: Anomaly Detection and Performance Optimization for End-to-End Data Transfers at Scale
协作研究:OAC 核心:小型:大规模端到端数据传输的异常检测和性能优化
  • 批准号:
    2412329
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CAREER: Efficient and Reliable Data Transfer Services for Next Generation Research Networks
职业:为下一代研究网络提供高效可靠的数据传输服务
  • 批准号:
    2145742
  • 财政年份:
    2022
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Collaborative Research: OAC Core: Small: Anomaly Detection and Performance Optimization for End-to-End Data Transfers at Scale
协作研究:OAC 核心:小型:大规模端到端数据传输的异常检测和性能优化
  • 批准号:
    2007789
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CRII: OAC: Online Optimization of End-to-End Data Transfers in High Performance Networks
CRII:OAC:高性能网络中端到端数据传输的在线优化
  • 批准号:
    1850353
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant

相似国自然基金

协变量自适应试验中的不可观测变量与异质性问题
  • 批准号:
    12301324
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于深度学习与蒙特卡罗算法的在线质子自适应放疗方法研究
  • 批准号:
    12375359
  • 批准年份:
    2023
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于内容自适应选择的生成式视频压缩算法研究
  • 批准号:
    62302466
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
融合自适应观测器的液压锚杆钻机全局滑模抗饱和控制方法
  • 批准号:
    62303464
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
工程化感觉神经在骨修复过程中自适应调控成骨/破骨平衡及其机制研究
  • 批准号:
    82372381
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Elements: Adaptive End-to-End Parallelism for Distributed Science Workflows
要素:分布式科学工作流程的自适应端到端并行性
  • 批准号:
    2427408
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Advancing Transplantation Tolerance in Nonhuman Primates
提高非人类灵长类动物的移植耐受性
  • 批准号:
    10622205
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
DNA sequence selectivity in conventional and aberrant V(D)J recombination
常规和异常 V(D)J 重组中的 DNA 序列选择性
  • 批准号:
    10586433
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
"Testing a Video and Text Messaging Intervention to reduce PTSD and Opioid Misuse Among Sexual Violence Survivors"
“测试视频和短信干预措施以减少性暴力幸存者的创伤后应激障碍和阿片类药物滥用”
  • 批准号:
    10812062
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
Deciphering DNA sequence selectivity in V(D)J recombination
破译 V(D)J 重组中的 DNA 序列选择性
  • 批准号:
    10307113
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了