CSR: Small: A Just-in-Time, Cross-Layer Instrumentation Framework for Diagnosing Performance Problems in Distributed Applications

CSR:小型:用于诊断分布式应用程序中性能问题的即时跨层仪表框架

基本信息

  • 批准号:
    1815323
  • 负责人:
  • 金额:
    $ 46.02万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-10-01 至 2020-02-29
  • 项目状态:
    已结题

项目摘要

Distributed applications running in data centers are critical to society (e.g., for shopping, banking). Engineers must diagnose and fix problems observed in data centers quickly; however, doing so is extremely challenging. A significant hurdle is that engineers must spend significant time and effort exploring what instrumentation (e.g., log messages about specific application behaviors) is needed to provide visibility into a new problem. To assist in this front, this project will develop an instrumentation framework that, in response to a new problem, will automatically search the space of possible instrumentation choices and enable the instrumentation needed to provide insight into it.This project addresses fundamental challenges associated with creating an automatic instrumentation framework: (a) What algorithms and heuristics are suited for automatically and efficiently exploring the instrumentation search space? (b) What architectural support is needed within the framework to enable automatic exploration? (c) How can the search space be explored without significantly impacting application performance? The proposal will explore the utility of algorithms based on operator knowledge, statistics, and machine learning to explore the search space. It will build on end-to-end tracing, as this will enable the framework to work for problems that affect different sets of requests.This project will inform the architecture of next-generation instrumentation frameworks, which are needed to keep pace with the ever-increasing complexity of distributed applications. The critical issues identified in popular open-source distributed applications while evaluating the framework will improve their robustness. Researchers will be able to leverage the software artifacts released by this project to create novel distributed-application-management tools that leverage the framework's unique capabilities. They will be able to deploy the framework in research clouds to obtain valuable workload traces from them. The project will generate course modules on diagnosis practices for distributed applications.The artifacts produced by this project, including framework source code, workload traces, instrumented applications, and research results, will be freely disseminated online at: https://massopen.cloud and https://www.rajasambasivan.com. All software artifacts will be stored in Github as well. All artifacts will be available for a minimum of seven years from the start of the project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在数据中心运行的分布式应用程序对社会至关重要(例如购物、银行业务)。 工程师必须快速诊断并修复数据中心中观察到的问题;然而,这样做极具挑战性。 一个重大障碍是工程师必须花费大量时间和精力来探索需要哪些仪器(例如,有关特定应用程序行为的日志消息)来提供对新问题的可见性。 为了在这方面提供帮助,该项目将开发一个仪器框架,该框架将自动搜索可能的仪器选择空间,并启用提供洞察力所需的仪器。该项目解决了与创建相关的基本挑战自动检测框架:(a) 哪些算法和启发法适合自动有效地探索检测搜索空间? (b) 框架内需要哪些架构支持才能实现自动探索? (c) 如何在不显着影响应用程序性能的情况下探索搜索空间? 该提案将探索基于操作员知识、统计和机器学习的算法在探索搜索空间方面的实用性。 它将建立在端到端跟踪的基础上,因为这将使框架能够解决影响不同请求集的问题。该项目将为下一代仪器框架的架构提供信息,这些框架需要与时俱进。 -分布式应用程序的复杂性增加。 在评估框架时发现流行的开源分布式应用程序中的关键问题将提高其稳健性。 研究人员将能够利用该项目发布的软件工件来创建新颖的分布式应用程序管理工具,以利用该框架的独特功能。 他们将能够在研究云中部署该框架,以从中获取有价值的工作负载跟踪。 该项目将生成有关分布式应用程序诊断实践的课程模块。该项目产生的工件,包括框架源代码、工作负载跟踪、仪表化应用程序和研究成果,将在网上免费传播:https://massopen.cloud 和https://www.rajasambasivan.com。 所有软件工件也将存储在 Github 中。 所有工件自项目开始起至少可使用七年。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An automated, cross-layer instrumentation framework for diagnosing performance problems in distributed applications
用于诊断分布式应用程序中性能问题的自动化跨层检测框架
  • DOI:
    10.1145/3357223.3362704
  • 发表时间:
    2019-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ates, Emre;Sturmann, Lily;Toslali, Mert;Krieger, Orran;Megginson, Richard;Coskun, Ayse K.;Sambasivan, Raja R.
  • 通讯作者:
    Sambasivan, Raja R.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Raja Sambasivan其他文献

Raja Sambasivan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Raja Sambasivan', 18)}}的其他基金

CAREER: Principled yet practical observability for a microservices-based cloud
职业:基于微服务的云的原则性且实用的可观察性
  • 批准号:
    2340128
  • 财政年份:
    2024
  • 资助金额:
    $ 46.02万
  • 项目类别:
    Continuing Grant
CSR: Small: A Just-in-Time, Cross-Layer Instrumentation Framework for Diagnosing Performance Problems in Distributed Applications
CSR:小型:用于诊断分布式应用程序中性能问题的即时跨层仪表框架
  • 批准号:
    2016178
  • 财政年份:
    2019
  • 资助金额:
    $ 46.02万
  • 项目类别:
    Standard Grant
CSR: Small: A Just-in-Time, Cross-Layer Instrumentation Framework for Diagnosing Performance Problems in Distributed Applications
CSR:小型:用于诊断分布式应用程序中性能问题的即时跨层仪表框架
  • 批准号:
    2016178
  • 财政年份:
    2019
  • 资助金额:
    $ 46.02万
  • 项目类别:
    Standard Grant

相似国自然基金

ALKBH5介导的SOCS3-m6A去甲基化修饰在颅脑损伤后小胶质细胞炎性激活中的调控作用及机制研究
  • 批准号:
    82301557
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miRNA前体小肽miPEP在葡萄低温胁迫抗性中的功能研究
  • 批准号:
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
PKM2苏木化修饰调节非小细胞肺癌起始细胞介导的耐药生态位的机制研究
  • 批准号:
    82372852
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于翻译组学理论探究LncRNA H19编码多肽PELRM促进小胶质细胞活化介导电针巨刺改善膝关节术后疼痛的机制研究
  • 批准号:
    82305399
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CLDN6高表达肿瘤细胞亚群在非小细胞肺癌ICB治疗抗性形成中的作用及机制研究
  • 批准号:
    82373364
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

An Open-source Speech Processing Platform (OSP) for Research on Hearing Loss and Related Disorders
用于研究听力损失和相关疾病的开源语音处理平台 (OSP)
  • 批准号:
    10629372
  • 财政年份:
    2022
  • 资助金额:
    $ 46.02万
  • 项目类别:
SHF: Small: Predictable Performance for Just-in-Time Compilation
SHF:小型:可预测的即时编译性能
  • 批准号:
    2139612
  • 财政年份:
    2022
  • 资助金额:
    $ 46.02万
  • 项目类别:
    Standard Grant
An Open-source Speech Processing Platform (OSP) for Research on Hearing Loss and Related Disorders
用于研究听力损失和相关疾病的开源语音处理平台 (OSP)
  • 批准号:
    10482312
  • 财政年份:
    2022
  • 资助金额:
    $ 46.02万
  • 项目类别:
Computer-based Learning to Enhance ADRD Care in Prison: Just Care for Dementia
基于计算机的学习可增强监狱中 ADRD 护理:只关注痴呆症
  • 批准号:
    10483628
  • 财政年份:
    2022
  • 资助金额:
    $ 46.02万
  • 项目类别:
SHF: Small: Software Testing Cognizant of Just-in-time Compilers
SHF:小型:了解即时编译器的软件测试
  • 批准号:
    2217696
  • 财政年份:
    2022
  • 资助金额:
    $ 46.02万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了