CSR:Small: Online System Anomaly Prediction and Diagnosis for Large-Scale Hosting Infrastructures
CSR:Small:大规模托管基础设施的在线系统异常预测与诊断
基本信息
- 批准号:0915567
- 负责人:
- 金额:$ 40.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Large-scale hosting infrastructures have become important platforms for many real-world systems such as cloud computing, enterprise data centers, massive data analytics, and web hosting services. Unfortunately, today's large-scale hosting infrastructures are still vulnerable to various system anomalies such as performance bottlenecks, resource hotspots, service level objective (SLO) violations, and various software/hardware failures. The goal of this project is to assess the viability of an online predictive anomaly management solution for large-scale hosting infrastructures. We will develop novel techniques for 1) performing light-weight online system anomaly prediction; 2) providing self-evolving anomaly prediction models to achieve high-quality prediction for real-world dynamic systems; and 3) performing speculative, ``hot" system anomaly diagnosis that search possible anomaly causes and suggest corrective actions while the system approaches the anomaly state. Our research will carry out evaluation by conducting experiments and case studies with our industrial partners on realistic platforms. Students supported by this project will gain experience with development and testing of robust real-world hosting infrastructures through interactions with our industrial partners, through internships and onsite experimentation. This work will advance diversity by involving students from under-represented groups. Particularly, the prototype developed in this project will be applied to the Virtual Computing Lab (VCL) at NCSU, a platform for providing a better educational experience for K-12, community colleges, and universities. This award is funded under the American Recovery and Reinvestment Act of 2009 (Public Law 111-5).
大规模托管基础设施已成为云计算、企业数据中心、海量数据分析和网络托管服务等许多现实系统的重要平台。不幸的是,当今的大规模托管基础设施仍然容易受到各种系统异常的影响,例如性能瓶颈、资源热点、服务级别目标(SLO)违规以及各种软件/硬件故障。该项目的目标是评估大规模托管基础设施的在线预测异常管理解决方案的可行性。我们将开发新技术:1)执行轻量级在线系统异常预测; 2)提供自演化的异常预测模型,实现对现实世界动态系统的高质量预测; 3)执行推测性的“热”系统异常诊断,在系统接近异常状态时搜索可能的异常原因并建议纠正措施。我们的研究将通过在现实平台上与工业合作伙伴进行实验和案例研究来进行评估。受该项目支持的学生将通过与我们的工业合作伙伴的互动、实习和现场实验来获得开发和测试强大的现实世界托管基础设施的经验。这项工作将通过让来自代表性不足的群体的学生参与来促进多样性。发达该项目的奖金将应用于北卡罗来纳州立大学的虚拟计算实验室 (VCL),该实验室是一个为 K-12、社区学院和大学提供更好教育体验的平台。该奖项由 2009 年美国复苏和再投资法案 (American Recovery and Reinvestment Act of 2009) 资助。公法 111-5)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Xiaohui Gu其他文献
Aerial Reconfigurable Intelligent Surface-Assisted Terrestrial Communications
空中可重构智能地面辅助地面通信
- DOI:
10.1109/iotm.001.2300141 - 发表时间:
2024-03-01 - 期刊:
- 影响因子:0
- 作者:
Xiaohui Gu;Wei Duan;Guoan Zhang;Miaowen Wen;Jaeho Choi;Pin - 通讯作者:
Pin
A Study of Security Vulnerabilities on Docker Hub
Docker Hub安全漏洞研究
- DOI:
10.1145/3029806.3029832 - 发表时间:
2017-03-22 - 期刊:
- 影响因子:0
- 作者:
Rui Shu;Xiaohui Gu;W. Enck - 通讯作者:
W. Enck
Fatigue life prediction of high‐speed train bearings based on the generalized linear cumulative damage theory
基于广义线性累积损伤理论的高速列车轴承疲劳寿命预测
- DOI:
10.1111/ffe.13984 - 发表时间:
2023-03-07 - 期刊:
- 影响因子:0
- 作者:
He‐Fei Li;Jia Wei;Shaochang Li;Yong;Xiaohui Gu;Ze‐Chao Liu;Shao - 通讯作者:
Shao
DScope: Detecting Real-World Data Corruption Hang Bugs in Cloud Server Systems
DScope:检测云服务器系统中真实的数据损坏挂起错误
- DOI:
10.1145/3267809.3267844 - 发表时间:
2018-10-11 - 期刊:
- 影响因子:0
- 作者:
Ting Dai;Jingzhu He;Xiaohui Gu;Shan Lu;Peipei Wang - 通讯作者:
Peipei Wang
Cooperative vehicular networks over Nakagami-m fading: Joint power control and spectrum scheduling
Nakagami-m 衰落下的协作车载网络:联合功率控制和频谱调度
- DOI:
10.1016/j.comnet.2023.110052 - 发表时间:
2023-10-01 - 期刊:
- 影响因子:0
- 作者:
Guoan Zhang;Wei Cao;Xiaohui Gu - 通讯作者:
Xiaohui Gu
Xiaohui Gu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Xiaohui Gu', 18)}}的其他基金
CSR: Medium:Collaborative Research:Holistic, Cross-Site, Hybrid System Anomaly Debugging for Large Scale Hosting Infrastructures
CSR:中:协作研究:大规模托管基础设施的整体、跨站点、混合系统异常调试
- 批准号:
1513942 - 财政年份:2015
- 资助金额:
$ 40.5万 - 项目类别:
Continuing Grant
CAREER: Enable Robust Virtualized Hosting Infrastructures via Coordinated Learning, Recovery, and Diagnosis
职业:通过协调学习、恢复和诊断实现强大的虚拟化托管基础设施
- 批准号:
1149445 - 财政年份:2012
- 资助金额:
$ 40.5万 - 项目类别:
Continuing Grant
CSR: Small: Collaborative Research: Hybrid Opportunistic Computing for Green Clouds
CSR:小型:协作研究:绿色云的混合机会计算
- 批准号:
0915861 - 财政年份:2009
- 资助金额:
$ 40.5万 - 项目类别:
Continuing Grant
相似国自然基金
靶向LC3与FUNDC1互作的小分子化合物及在线虫中的抗衰老机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
针对小分子污染物的在线分析方法及其应用研究
- 批准号:U21A20290
- 批准年份:2021
- 资助金额:260 万元
- 项目类别:
融合光学和视觉原理的小模数粉末冶金齿轮高精度快速在线检测的理论及技术研究
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
基于并行计算的大规模电力系统小干扰稳定在线分析与安全预警研究
- 批准号:51677164
- 批准年份:2016
- 资助金额:58.0 万元
- 项目类别:面上项目
用于痫样脑电在线检测的gm-C小波滤波器实现理论与方法研究
- 批准号:61504008
- 批准年份:2015
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: CSR: Small: Expediting Continual Online Learning on Edge Platforms through Software-Hardware Co-designs
协作研究:企业社会责任:小型:通过软硬件协同设计加快边缘平台上的持续在线学习
- 批准号:
2312158 - 财政年份:2023
- 资助金额:
$ 40.5万 - 项目类别:
Standard Grant
Collaborative Research: CSR: Small: Expediting Continual Online Learning on Edge Platforms through Software-Hardware Co-designs
协作研究:企业社会责任:小型:通过软硬件协同设计加快边缘平台上的持续在线学习
- 批准号:
2312157 - 财政年份:2023
- 资助金额:
$ 40.5万 - 项目类别:
Standard Grant
CSR: Small: Improving Data Center Water Efficiency via Online Resource Management
CSR:小型:通过在线资源管理提高数据中心用水效率
- 批准号:
1565474 - 财政年份:2015
- 资助金额:
$ 40.5万 - 项目类别:
Standard Grant
CSR: Small: Software Infrastructure for Online Analytics
CSR:小型:在线分析软件基础设施
- 批准号:
1422338 - 财政年份:2014
- 资助金额:
$ 40.5万 - 项目类别:
Standard Grant
CSR: Small: Improving Data Center Water Efficiency via Online Resource Management
CSR:小型:通过在线资源管理提高数据中心用水效率
- 批准号:
1423137 - 财政年份:2014
- 资助金额:
$ 40.5万 - 项目类别:
Standard Grant