NeTS: CSR: Medium: Collaborative Research: Enabling Flexible and High Performance Big Data Analytics Over Geo-Distributed Clouds

NeTS:CSR:中:协作研究:通过地理分布式云实现灵活且高性能的大数据分析

基本信息

项目摘要

Large organizations and small enterprises alike leverage datacenters across the globe to offer Internet services to their users. These sites routinely gather data pertaining to end user activities to provide better services, and they collect server monitoring logs and performance counters to ensure uninterrupted service. Although fast, efficient, and cost-effective analyses of these large datasets can significantly improve users' quality of experience and enable novel applications, the wide area network (WAN) that connects the datacenters poses a considerable challenge: because WAN bandwidth is limited and expensive, and WAN latency is high and variable, both the performance and timeliness of analytics are affected by the WAN.This project aims to build a new WAN-aware big data stack customized for flexible geo-distributed data analytics. The project will not impose any constraints on the set of queries that can be issued, and it will support a variety of performance objectives including obtaining timely responses, minimizing batch completion times, or using minimal bandwidth. To account for unpredictable and fine-timescale changes to WAN conditions and to enable coordination among the actions taken by different layers of the analytics stack, this project will enable holistic, cross-layer visibility and optimizations. It will incorporate awareness of the geo-distributed setting in the stack's upper layers (e.g., query optimization) and of application-level objectives in the lower layers (e.g., networking). This will result in a radical re-factoring of the API and interfaces between query optimization, query execution, resource negotiation, wide-area storage, and network routing/scheduling.Software artifacts from this project will be incorporated into existing open source big data stacks, making the research outcomes broadly available for public reuse. The experimental harnesses will be made available to ensure repeatability and to foster follow up research. The research outcomes will guide industry evolution as the industry slowly shifts from single-datacenter to geo-distributed settings. The project has a substantial educational component involving the introduction of new courses on big data systems at both graduate and undergraduate levels that will involve hands-on exercises with state-of-the-art big data software, and it will reach out to high-school students, women, and underrepresented minorities through big data boot camps.
大型组织和小型企业都利用全球的数据中心为其用户提供互联网服务。这些站点通常会收集与最终用户活动有关的数据,以提供更好的服务,并收集服务器监视日志和性能计数器,以确保不间断的服务。尽管对这些大型数据集的快速,高效和具有成本效益的分析可以显着提高用户的体验质量并启用新颖的应用程序,但连接数据中心的广域网络(WAN)构成了一个巨大的挑战:因为WAN带宽有限且昂贵,WAN潜伏期较高且可变,分析的性能和及时性都受WAN的影响。该项目旨在构建一个新的WAN-Aware Aware大数据堆栈,以定制用于灵活的地理分布数据分析。该项目将不会对可以发出的一系列查询施加任何限制,并且将支持各种绩效目标,包括获得及时的响应,最小化批次完成时间或使用最小的带宽。为了解释WAN条件的不可预测和微观的变化,并在不同层的分析堆栈采取的行动之间进行协调,该项目将使整体,跨层的可见性和优化。它将在堆栈的上层(例如查询优化)和下层中的应用级目标(例如网络)中纳入对地理分布的设置的认识。这将导致对查询优化,查询执行,资源谈判,广阔区域存储和网络路由/调度之间的API和接口的根本性重新分配。该项目的Software工件将被纳入现有的开源大数据堆栈中,使研究成果广泛可供公开重复使用。将提供实验线束以确保重复性并促进后续研究。研究成果将指导行业的发展,因为该行业从单人群慢慢转变为地理分布的设置。该项目具有实质性的教育部分,涉及在研究生和本科级别上引入有关大数据系统的新课程,这将涉及使用最先进的大数据软件的动手练习,并且它将接触到高级 - 学校的学生,女性和人数不足的少数民族通过大数据新兵训练营。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mosharaf Chowdhury其他文献

CDI-E: An Elastic Cloud Service for Data Engineering
CDI-E:数据工程的弹性云服务
  • DOI:
    10.14778/3554821.3554825
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prakash Das;Shivangi Srivastava;Valentin Moskovich;Anmol Chaturvedi;Anant Mittal;Yongqin Xiao;Mosharaf Chowdhury
  • 通讯作者:
    Mosharaf Chowdhury
Fair Allocation of Heterogeneous and InterchangeableResources
异构和可互换资源的公平分配
  • DOI:
    10.1145/3305218.3305227
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiao Sun;T. Le;Mosharaf Chowdhury;Zhenhua Liu
  • 通讯作者:
    Zhenhua Liu
Coflow: A Networking Abstraction for Distributed Data-Parallel Applications
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mosharaf Chowdhury
  • 通讯作者:
    Mosharaf Chowdhury
Pyxis: Scheduling Mixed Tasks in Disaggregated Datacenters
Pyxis:在分类数据中心调度混合任务
Efficient Large Language Models: A Survey
高效的大型语言模型:调查
  • DOI:
    10.48550/arxiv.2312.03863
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhongwei Wan;Xin Wang;Che Liu;Samiul Alam;Yu Zheng;Jiachen Liu;Zhongnan Qu;Shen Yan;Yi Zhu;Quanlu Zhang;Mosharaf Chowdhury;Mi Zhang
  • 通讯作者:
    Mi Zhang

Mosharaf Chowdhury的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mosharaf Chowdhury', 18)}}的其他基金

Collaborative Research: Conference: NSF NeTS PI Meeting - Spring 2023
协作研究:会议:NSF NeTS PI 会议 - 2023 年春季
  • 批准号:
    2309858
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: NGSDI: Foundations of Clean and Balanced Datacenters: Treehouse
合作研究:NGSDI:清洁和平衡数据中心的基础:Treehouse
  • 批准号:
    2104243
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CNS Core: Medium: Systems Support for Federated Learning
协作研究:CNS 核心:中:联邦学习的系统支持
  • 批准号:
    2106184
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Medium: Collaborative Research: Towards Enabling Optimal Performance-Cost Tradeoffs in Distributed Storage
CNS 核心:中:协作研究:实现分布式存储中的最佳性能与成本权衡
  • 批准号:
    1900665
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CAREER: End-to-End Network Design for Unified Memory Disaggregation
职业:统一内存分解的端到端网络设计
  • 批准号:
    1845853
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Multi-Scale GPU Resource Management for AI Applications
CNS 核心:小型:AI 应用的多规模 GPU 资源管理
  • 批准号:
    1909067
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
XPS: FULL: A Cross-Layer Approach Toward Low-Latency Data-Parallel Applications in Rack-Scale Computing
XPS:FULL:机架规模计算中低延迟数据并行应用的跨层方法
  • 批准号:
    1629397
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
NeTS: Small: Collaborative Research: Enabling Application-Level Performance Predictability in Public Clouds
NeTS:小型:协作研究:在公共云中实现应用程序级性能可预测性
  • 批准号:
    1617773
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

准社会互动视角下CSR数字化沟通对品牌绩效的差异化影响、机制与管理对策
  • 批准号:
    72362008
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
善行得善果?后疫情时代嵌入式和边缘式CSR对员工幸福感的跨层影响研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
基于脊髓突触可塑性探讨“调气”电针远端腧穴干预CSR模型大鼠的中枢镇痛效应及机制研究
  • 批准号:
    82160934
  • 批准年份:
    2021
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目
利用输运模型和机器学习方法研究CSR能区的低温高密核物质
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    50 万元
  • 项目类别:
    联合基金项目
PPR家族蛋白CSR3调控拟南芥叶绿体RNA剪接的分子机理
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CSR: NeTS: Medium: Collaborative Research: Cloud Support for Latency-Sensitive Web Services
CSR:NeTS:媒介:协作研究:对延迟敏感的 Web 服务的云支持
  • 批准号:
    1835253
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CSR: NeTS: Medium: Achieving High-Availability in the Face of Rapid Network Evolution in Large Content Providers
CSR:NeTS:中:在大型内容提供商网络快速演进的情况下实现高可用性
  • 批准号:
    1705086
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CSR: NeTS: Medium: Achieving High-Availability in the Face of Rapid Network Evolution in Large Content Providers
CSR:NeTS:中:在大型内容提供商网络快速演进的情况下实现高可用性
  • 批准号:
    1827977
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
NeTS: CSR: Medium: Network Functions Virtualization With Timing Guarantees
NeTS:CSR:媒介:具有时序保证的网络功能虚拟化
  • 批准号:
    1563873
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CSR: NeTS: Medium: Collaborative Research: Cloud Support for Latency-Sensitive Web Services
CSR:NeTS:媒介:协作研究:对延迟敏感的 Web 服务的云支持
  • 批准号:
    1563849
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了