CNS Core: Small: Offline Inference for Ultra-Efficient Memory Management

CNS 核心:小型:离线推理以实现超高效内存管理

基本信息

  • 批准号:
    2128653
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Machine learning (ML) has made its way into systems of various kinds, helping them make informed decisions at critical points. A typical approach to ML-for-systems is to perform inference online by querying a model with runtime data. Online inference incurs non-trivial overheads, imposing a tight restriction on model size and complexity. In fact, systems that involve ML in their decision making often use very simple models (e.g., linear models) with inferior accuracy. This project develops a transformative approach to ML-for-systems - instead of doing online inference, this project advocates to train models that can predict runtime properties directly from program source code. As such, inference can be done offline and their results can be encoded and efficiently looked up during execution. Given that inference no longer contributes to run time, the proposed approach removes the above-discussed restrictions, enabling systems to employ state-of-the-art model architectures. This project further applies offline inference to memory management tasks that are critical to cloud applications. Modern society relies on services provided by large-scale systems. Improving the throughput and efficiency of such systems improves the service-level efficiency and scalability that human can experience in their lives. Replacing complicated and heuristics-driven decision making in today’s memory management systems with learning has a potential to dramatically reduce the cost of allocation and deallocation, which is a significant component in an application’s execution. Traditionally, inference is performed online, restricting what models to use and how high the accuracy can reach. This project develops techniques that make ML a more appealing approach by removing these restrictions. The techniques proposed span runtime system and ML. This interdisciplinary nature produces research that has impact in both areas. The project also makes efforts in education and diversity by incorporating research into courses and recruiting researchers from underrepresented groups.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
机器学习 (ML) 已进入各种类型的系统,帮助他们在关键点做出明智的决策。 机器学习的典型方法是通过使用运行时数据查询模型来执行在线推理。 - 琐碎的开销,对模型大小和复杂性施加严格限制。事实上,在决策中涉及机器学习的系统通常使用非常简单的模型(例如线性模型),但精度较低。 ML-for-systems - 该项目主张训练可以直接从程序源代码预测运行时属性的模型,而不是进行在线推理,因此可以离线进行推理,并且可以在执行期间对其结果进行编码和有效查找。鉴于推理不再影响运行时间,所提出的方法消除了上述限制,使系统能够采用最先进的模型架构,该项目进一步将离线推理应用于对云应用程序至关重要的内存管理任务。 .现代社会依赖提高此类系统的吞吐量和效率可以提高人们在生活中体验到的服务级别效率和可扩展性,用学习取代当今内存管理系统中复杂的、启发式的决策制定具有重要意义。显着降低分配和释放成本的潜力,这是应用程序执行中的一个重要组成部分。传统上,推理是在线执行的,限制了使用的模型以及可以达到的准确度。通过消除这些限制,机器学习成为一种更具吸引力的方法,这种跨学科性质产生了对这两个领域都有影响的研究,该项目还通过将研究纳入课程并招募代表性不足的研究人员来努力实现教育和多样性。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Harry Xu其他文献

Accelerating Graph Mining Systems with Subgraph Morphing
通过子图变形加速图挖掘系统
A Tale of Two Paths: Toward a Hybrid Data Plane for Efficient Far-Memory Applications
两条路径的故事:走向高效远程内存应用的混合数据平面
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lei Chen;Shi Liu;Chenxi Wang;Haoran Ma;Yifan Qiao;†. ZheWang;†. ChenggangWu;Youyou Lu;†. XiaobingFeng;Huimin Cui;Shan Lu;Harry Xu
  • 通讯作者:
    Harry Xu
This paper is included in the Proceedings of the 21st USENIX Symposium on Networked Systems Design and Implementation.
本文收录于第 21 届 USENIX 网络系统设计与实现研讨会论文集。
Zenix: Efficient Execution of Bulky Serverless Applications
Zenix:高效执行大型无服务器应用程序
  • DOI:
    10.1190/tle36030208.1
  • 发表时间:
    2022-06-27
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Zhiyuan Guo;Zachary Blanco;Mohammad Shahrad;Zeru Wei;Bili Dong;Jinmou Li;Ishaan Pota;Harry Xu;Yiying Zhang
  • 通讯作者:
    Yiying Zhang
Parcae: Proactive, Liveput-Optimized DNN Training on Preemptible Instances
  • DOI:
    10.48550/arxiv.2403.14097
  • 发表时间:
    2024-03-21
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiangfei Duan;Ziang Song;Xupeng Miao;Xiaoli Xi;Dahua Lin;Harry Xu;Minjia Zhang;Zhihao Jia
  • 通讯作者:
    Zhihao Jia

Harry Xu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Harry Xu', 18)}}的其他基金

CSR: Small: Elastic Soft State Cache as an OS Service
CSR:小型:弹性软状态缓存作为操作系统服务
  • 批准号:
    2330831
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Medium: Reinvented Data Plane for Memory-Disaggregated Datacenters
协作研究:CNS 核心:中:为内存分解数据中心重新发明数据平面
  • 批准号:
    2106838
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Semeru: A memory-disaggregated managed runtime
CNS 核心:小型:Semeru:内存分解的托管运行时
  • 批准号:
    2007737
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Improved Memory Management for Object-Oriented Big Data Systems
CSR:小:改进面向对象大数据系统的内存管理
  • 批准号:
    1907352
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Improved Memory Management for Object-Oriented Big Data Systems
CSR:小:改进面向对象大数据系统的内存管理
  • 批准号:
    1613023
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Medium: Collaborative Research: Improved Performance Testing and Debugging
SHF:中:协作研究:改进的性能测试和调试
  • 批准号:
    1409829
  • 财政年份:
    2014
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Runtime System Support for Automated Object Recycling
CSR:小型:运行时系统支持自动对象回收
  • 批准号:
    1321179
  • 财政年份:
    2013
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

基于NRF2调控KPNB1促进PD-L1核转位介导非小细胞肺癌免疫治疗耐药的机制研究
  • 批准号:
    82303969
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
polyG蛋白聚集体诱导小胶质细胞活化在神经元核内包涵体病中的作用及机制研究
  • 批准号:
    82301603
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
前丘脑室旁核小胶质细胞经由TNF-α参与强迫进食行为的作用及机制研究
  • 批准号:
    82301521
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
小胶质细胞调控外侧隔核-腹侧被盖区神经环路介导社交奖赏障碍的机制研究
  • 批准号:
    82304474
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
空间邻近标记技术研究莱茵衣藻蛋白核小管与碳浓缩机制的潜在关系
  • 批准号:
    32300220
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
  • 批准号:
    2322919
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
  • 批准号:
    2343469
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Accelerating Serverless Cloud Network Performance
协作研究:CNS 核心:小型:加速无服务器云网络性能
  • 批准号:
    2229454
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF-BSF: CNS Core: Small: Reliable and Zero-Power Timekeepers for Intermittently Powered Computing Devices via Stochastic Magnetic Tunnel Junctions
NSF-BSF:CNS 核心:小型:通过随机磁隧道结为间歇供电计算设备提供可靠且零功耗的计时器
  • 批准号:
    2400463
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
  • 批准号:
    2230945
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了