Collaborative Research: EAGER: Automating CI Configuration Troubleshooting with Bayesian Group Testing

协作研究:EAGER:使用贝叶斯组测试自动化 CI 配置故障排除

基本信息

  • 批准号:
    2333324
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

Configuration troubleshooting in large-scale cyberinfrastructure (CI) software systems is a complex and costly task due to numerous configurable parameters. Existing methods like log mining and machine learning analysis face challenges in such environments. To address this, we present BGT4AutoCI (Automating CI Configuration Troubleshooting with Bayesian Group Testing), a groundbreaking solution that leverages Bayesian Group Testing, ensuring accurate results even with minimal prior knowledge and testing errors. Experienced CI operators can expedite the process with approximated prior knowledge. This research aims to revolutionize CI configuration troubleshooting, introducing a highly precise and efficient approach that will optimize the utilization of current and future large-scale CI systems.The primary focus of this research is to address critical challenges in automated configuration troubleshooting within large-scale CI systems. The proposed three-fold approach encompasses: (1) Formulating Bayesian Group Testing for CI configuration troubleshooting, which employs lattice models to accurately identify risks at the individual configuration parameter level, taking uncertainty into account during troubleshooting. (2) A multinomial paradigm for Bayesian Group Testing, which introduces multinomial responses to simultaneously observe multiple aspects of CI systems, enabling efficient test selection algorithms for jointly testing configuration parameters that impact various aspects of CIs. (3) Automated configuration troubleshooting, which involves the designs of several key components to establish BGT4AutoCI as an automated configuration troubleshooting framework that minimizes the need for human intervention. The outcomes of this project hold the potential to significantly enhance the efficiency and accuracy of CI configuration troubleshooting, benefiting current and future large-scale CI systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
由于可配置参数众多,大规模网络基础设施 (CI) 软件系统中的配置故障排除是一项复杂且成本高昂的任务。日志挖掘和机器学习分析等现有方法在此类环境中面临挑战。为了解决这个问题,我们推出了 BGT4AutoCI(使用贝叶斯组测试自动进行 CI 配置故障排除),这是一种利用贝叶斯组测试的突破性解决方案,即使在先验知识和测试错误最少的情况下也能确保准确的结果。经验丰富的 CI 操作员可以利用近似的先验知识来加快这一过程。这项研究旨在彻底改变 CI 配置故障排除,引入一种高精度和高效的方法,以优化当前和未来的大规模 CI 系统的利用率。这项研究的主要重点是解决大规模自动化配置故障排除的关键挑战持续集成系统。所提出的三重方法包括:(1)制定用于 CI 配置故障排除的贝叶斯组测试,该测试采用格模型来准确识别单个配置参数级别的风险,并在故障排除期间考虑不确定性。 (2) 贝叶斯组测试的多项式范式,引入多项式响应来同时观察 CI 系统的多个方面,从而实现有效的测试选择算法来联合测试影响 CI 各个方面的配置参数。 (3)自动化配置故障排除,涉及几个关键组件的设计,以将BGT4AutoCI建立为自动化配置故障排除框架,最大限度地减少人工干预的需要。该项目的成果有可能显着提高 CI 配置故障排除的效率和准确性,使当前和未来的大型 CI 系统受益。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值进行评估,被认为值得支持以及更广泛的影响审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xiaoyi Lu其他文献

DataMPI: Extending MPI to Hadoop-Like Big Data Computing
DataMPI:将 MPI 扩展到类似 Hadoop 的大数据计算
2015 Ieee International Conference on Big Data (big Data) Benchmarking Key-value Stores on High-performance Storage and Interconnects for Web-scale Workloads*
2015 年 Ieee 国际大数据会议(大数据)针对 Web 规模工作负载的高性能存储和互连的键值存储进行基准测试*
HOMR: a hybrid approach to exploit maximum overlapping in MapReduce over high performance interconnects
HOMR:一种在高性能互连上利用 MapReduce 最大重叠的混合方法
  • DOI:
    10.1145/2597652.2597684
  • 发表时间:
    2014-06-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Md. Wasi;Xiaoyi Lu;Nusrat S. Islam;D. P;a;a
  • 通讯作者:
    a
A method for detection and parameter inversion of ocean eddies in SAR images
SAR图像海洋涡流检测与参数反演方法
EC-Bench: Benchmarking Onload and Offload Erasure Coders on Modern Hardware Architectures
EC-Bench:现代硬件架构上加载和卸载擦除编码器的基准测试
  • DOI:
    10.1007/978-3-030-32813-9_18
  • 发表时间:
    2018-12-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haiyang Shi;Xiaoyi Lu;D. P;a;a
  • 通讯作者:
    a

Xiaoyi Lu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xiaoyi Lu', 18)}}的其他基金

CAREER: Heterogeneity-Enriched Communication for Advancing HPC Systems and Applications
职业:丰富异构性的通信以推进 HPC 系统和应用程序
  • 批准号:
    2340982
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CyberTraining: Pilot: Cross-Layer Training of High-Performance Deep Learning Technologies and Applications for Research Workforce Development in Central Valley
网络培训:试点:高性能深度学习技术和应用程序的跨层培训,用于中央谷研究人员的发展
  • 批准号:
    2321123
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Memory Fabric: Data Management for Large-scale Hybrid Memory Systems
SPX:协作研究:内存结构:大规模混合内存系统的数据管理
  • 批准号:
    2132049
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Memory Fabric: Data Management for Large-scale Hybrid Memory Systems
SPX:协作研究:内存结构:大规模混合内存系统的数据管理
  • 批准号:
    1822987
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
  • 批准号:
    82304250
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肠道普拉梭菌代谢物丁酸抑制心室肌铁死亡改善老龄性心功能不全的机制研究
  • 批准号:
    82300430
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
社会网络关系对公司现金持有决策影响——基于共御风险的作用机制研究
  • 批准号:
    72302067
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向图像目标检测的新型弱监督学习方法研究
  • 批准号:
    62371157
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向开放域对话系统信息获取的准确性研究
  • 批准号:
    62376067
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345582
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347623
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: IMPRESS-U: Groundwater Resilience Assessment through iNtegrated Data Exploration for Ukraine (GRANDE-U)
合作研究:EAGER:IMPRESS-U:通过乌克兰综合数据探索进行地下水恢复力评估 (GRANDE-U)
  • 批准号:
    2409395
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: The next crisis for coral reefs is how to study vanishing coral species; AUVs equipped with AI may be the only tool for the job
合作研究:EAGER:珊瑚礁的下一个危机是如何研究正在消失的珊瑚物种;
  • 批准号:
    2333604
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了