SPX: Collaborative Research: NG4S: A Next-generation Geo-distributed Scalable Stateful Stream Processing System

SPX:合作研究:NG4S:下一代地理分布式可扩展状态流处理系统

基本信息

项目摘要

Our society increasingly relies on applications that process streaming data across geo-distributed sites, such as making business decisions from marketing data, identifying spam campaigns in social network streams, and analyzing genome datasets in different labs and countries to track the sources of potential epidemics. State-of-art solutions for these needs are centered around stateless stream processing. This project advances stream processing to enable next-generation streaming applications to store and update state along with computation, therefore processing live data streams in a timely fashion from massive and geo-distributed datasets. Existing systems are mainly designed for stateless stream processing in intra-datacenter settings and do not scale well for running stream applications that contain large distributed states. This project breaks the traditional abstractions of a centralized architecture and hashtable-based stateless operators, redefining them with a new decentralized architecture and new memory-efficient stateful operators, which enables novel approaches to improve overall system performance and scalability. This project builds a next-generation geo-distributed scalable stateful stream processing system that will significantly improve the scalability of stream processing systems. This work includes three primary research directions. (1) At the architecture level, a new decentralized 'many masters/many workers' architecture will be proposed, which provides each master with maximum independence. (2) At the operator level, a new in-memory data structure will be designed and implemented to store application state and minimize the memory overhead so as to handle 'big data' requirements. (3) A new shard-based parallel recovery mechanism will be proposed to handle failures and stragglers in a scalable way. All three parts of the project will be prototyped and implemented on a widely adopted stream processing system (Apache Storm).This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
我们的社会越来越依赖于处理跨地理分布式站点的流数据的应用程序,例如根据营销数据做出业务决策,识别社交网络流中的垃圾邮件活动,以及分析不同实验室和国家的基因组数据集以跟踪潜在流行病的来源。满足这些需求的最先进的解决方案以无状态流处理为中心。该项目推进了流处理,使下一代流应用程序能够在计算的同时存储和更新状态,从而及时处理来自海量地理分布式数据集的实时数据流。现有系统主要是为数据中心内设置中的无状态流处理而设计的,并且不能很好地扩展以运行包含大型分布式状态的流应用程序。该项目打破了集中式架构和基于哈希表的无状态运算符的传统抽象,用新的去中心化架构和新的内存高效有状态运算符重新定义了它们,从而实现了提高整体系统性能和可扩展性的新方法。 该项目构建了下一代地理分布式可扩展有状态流处理系统,将显着提高流处理系统的可扩展性。这项工作包括三个主要研究方向。 (1)在架构层面,将提出一种新的去中心化的“多master/多worker”架构,为每个master提供最大的独立性。 (2) 在操作层面,将设计并实现一种新的内存数据结构来存储应用程序状态并最小化内存开销,从而满足“大数据”需求。 (3)将提出一种新的基于分片的并行恢复机制,以可扩展的方式处理故障和掉队。该项目的所有三个部分都将在广泛采用的流处理系统(Apache Storm)上进行原型设计和实施。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
FP4S: Fragment-based Parallel State Recovery for Stateful Stream Applications
Achieving Online and Scalable Information Integrity by Harnessing Social Spam Correlations
  • DOI:
    10.1109/access.2023.3236604
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Hailu Xu;Pinchao Liu;Boyuan Guan;Qingyang Wang;Dilma Da Silva;Liting Hu
  • 通讯作者:
    Hailu Xu;Pinchao Liu;Boyuan Guan;Qingyang Wang;Dilma Da Silva;Liting Hu
XUnified: A Framework for Guiding Optimal Use of GPU Unified Memory
XUnified:指导 GPU 统一内存优化使用的框架
  • DOI:
    10.1109/access.2022.3196008
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Xu, Hailu;Lin, Pei-Hung;Emani, Murali;Hu, Liting;Liao, Chunhua
  • 通讯作者:
    Liao, Chunhua
DART: A Scalable and Adaptive Edge Stream Processing Engine
DART:可扩展的自适应边缘流处理引擎
Adaptive Fragment-Based Parallel State Recovery for Stream Processing Systems
  • DOI:
    10.1109/tpds.2023.3251997
  • 发表时间:
    2023-08
  • 期刊:
  • 影响因子:
    5.3
  • 作者:
    Hailu Xu;Pinchao Liu;Sarker Tanzir Ahmed;Dilma Da Silva;Liting Hu
  • 通讯作者:
    Hailu Xu;Pinchao Liu;Sarker Tanzir Ahmed;Dilma Da Silva;Liting Hu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Liting Hu其他文献

Project Hoover: auto-scaling streaming map-reduce applications
Project Hoover:自动缩放流式 Map-Reduce 应用程序
RBAY: A Scalable and Extensible Information Plane for Federating Distributed Datacenter Resources
RBAY:用于联合分布式数据中心资源的可扩展且可扩展的信息平面
Breaking Down Hadoop Distributed File Systems Data Analytics Tools: Apache Hive vs. Apache Pig vs. Pivotal HWAQ
分解 Hadoop 分布式文件系统数据分析工具:Apache Hive、Apache Pig 与 Pivotal HWAQ
Laser-induced interfacial state changes enable tuning of the Schottky-barrier height in SiC
激光引起的界面状态变化能够调节 SiC 中的肖特基势垒高度
  • DOI:
    10.1016/j.apsusc.2018.11.015
  • 发表时间:
    2019-03
  • 期刊:
  • 影响因子:
    6.7
  • 作者:
    Zhenyuan Lin;Lingfei Ji;Yan Wu;Liting Hu;Tianyang Yan;Zhengyang Sun
  • 通讯作者:
    Zhengyang Sun
Max orientation coverage: efficient path planning to avoid collisions in the CNC milling of 3D objects
最大方向覆盖范围:有效的路径规划,以避免 3D 对象 CNC 铣削中的碰撞

Liting Hu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Liting Hu', 18)}}的其他基金

CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
  • 批准号:
    2322919
  • 财政年份:
    2024
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
OAC Core: A Scalable and Deployable Container Orchestration Cyber Infrastructure Toolkit for Deploying Big Data Analytics Applications in Public Cloud
OAC Core:用于在公共云中部署大数据分析应用程序的可扩展和可部署的容器编排网络基础设施工具包
  • 批准号:
    2313738
  • 财政年份:
    2023
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
OAC Core: A Scalable and Deployable Container Orchestration Cyber Infrastructure Toolkit for Deploying Big Data Analytics Applications in Public Cloud
OAC Core:用于在公共云中部署大数据分析应用程序的可扩展和可部署的容器编排网络基础设施工具包
  • 批准号:
    2212256
  • 财政年份:
    2022
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
CAREER: Scalable and Adaptive Edge Stream Processing
职业:可扩展和自适应边缘流处理
  • 批准号:
    2313737
  • 财政年份:
    2022
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Continuing Grant
CAREER: Scalable and Adaptive Edge Stream Processing
职业:可扩展和自适应边缘流处理
  • 批准号:
    2205677
  • 财政年份:
    2021
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Continuing Grant
CAREER: Scalable and Adaptive Edge Stream Processing
职业:可扩展和自适应边缘流处理
  • 批准号:
    1943071
  • 财政年份:
    2020
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Continuing Grant
SPX: Collaborative Research: NG4S: A Next-generation Geo-distributed Scalable Stateful Stream Processing System
SPX:合作研究:NG4S:下一代地理分布式可扩展状态流处理系统
  • 批准号:
    1919126
  • 财政年份:
    2019
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant

相似国自然基金

基于交易双方异质性的工程项目组织间协作动态耦合研究
  • 批准号:
    72301024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向协作感知车联网的信息分发时效性保证关键技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数据物理驱动的车间制造服务协作可靠性机理与优化方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目

相似海外基金

SPX: Collaborative Research: Automated Synthesis of Extreme-Scale Computing Systems Using Non-Volatile Memory
SPX:协作研究:使用非易失性存储器自动合成超大规模计算系统
  • 批准号:
    2408925
  • 财政年份:
    2023
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Scalable Neural Network Paradigms to Address Variability in Emerging Device based Platforms for Large Scale Neuromorphic Computing
SPX:协作研究:可扩展神经网络范式,以解决基于新兴设备的大规模神经形态计算平台的可变性
  • 批准号:
    2401544
  • 财政年份:
    2023
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Intelligent Communication Fabrics to Facilitate Extreme Scale Computing
SPX:协作研究:促进超大规模计算的智能通信结构
  • 批准号:
    2412182
  • 财政年份:
    2023
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Cross-stack Memory Optimizations for Boosting I/O Performance of Deep Learning HPC Applications
SPX:协作研究:用于提升深度学习 HPC 应用程序 I/O 性能的跨堆栈内存优化
  • 批准号:
    2318628
  • 财政年份:
    2022
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: FASTLEAP: FPGA based compact Deep Learning Platform
SPX:协作研究:FASTLEAP:基于 FPGA 的紧凑型深度学习平台
  • 批准号:
    2333009
  • 财政年份:
    2022
  • 资助金额:
    $ 29.93万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了