III: Small: Rethinking the Data Organization and Lifecycle in LSM Storage Systems

III:小:重新思考 LSM 存储系统中的数据组织和生命周期

基本信息

  • 批准号:
    2227669
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-01-01 至 2025-12-31
  • 项目状态:
    未结题

项目摘要

To support the efficient storing of large amounts of data, many modern database systems use the Log Structured Merge tree (LSM) technology. This technology allows grouping many data updates together, before applying them to the database. This project has identified several limitations of LSM storage, which cause reduced rates of reads and writes to the database system. Specifically, current LSM systems do not consider the hotness of a data record when deciding how to store it, and may also suffer from periodic stalls, where the system may become unresponsive while large maintenance operations, called merges, are performed. Further, LSM systems are inefficient at exploiting larger computer memories. The developed techniques create novel data organization and flow patterns in the LSM storage, which leverage modern hardware capabilities to boost the read and write capabilities of the storage system. Improving the performance of database systems will allow storing larger data at lower costs, thus making storage systems more accessible to scientists and general users. This project will also strengthen and extend the ongoing undergraduate research and high school outreach activities of the investigators. The project has several research aims. First, algorithms will be developed to store frequently accessed records in more accessible locations for faster retrieval. This will facilitate a bi-directional LSM tree architecture, where records flow both top-down and bottom-up. This will allow naturally maintaining hot records together, for faster querying and more effective caching. Second, new algorithms will be created to improve the speed of data merges. Periodic merges are used to maintain the stored data organized and consistent. This aim will study how to universally partition LSM runs to facilitate splitting a large merge into multiple disjoint sub-merges, thus reducing stall periods. The third aim will create algorithms to better utilize large memory sizes and multithreading parallelism, and develop a mixed memory-disk LSM tree. The key idea is that, instead of directly enlarging the MemTable, where recent writes are buffered, some components can be pinned in memory, with a more efficient organization, and enable parallel execution on queries. The project includes theoretical analysis, experimental study and software development. The developed algorithms are tested on real-world data and integrated in real database systems. This integration may increase the impact of the project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
为了支持大量数据的高效存储,许多现代数据库系统使用日志结构化合并树(LSM)技术。该技术允许在将许多数据更新应用到数据库之前将它们分组在一起。该项目发现了 LSM 存储的几个限制,这些限制导致数据库系统的读写速率降低。具体来说,当前的 LSM 系统在决定如何存储数据记录时不考虑数据记录的热度,并且还可能遭受周期性停顿,其中系统可能在执行称为合并的大型维护操作时变得无响应。此外,LSM 系统在利用更大的计算机内存方面效率低下。所开发的技术在 LSM 存储中创建了新颖的数据组织和流动模式,利用现代硬件功能来增强存储系统的读写能力。提高数据库系统的性能将允许以更低的成本存储更大的数据,从而使存储系统更容易被科学家和普通用户使用。该项目还将加强和扩展研究人员正在进行的本科研究和高中外展活动。该项目有几个研究目标。首先,将开发算法将经常访问的记录存储在更容易访问的位置,以便更快地检索。这将促进双向 LSM 树架构,其中记录自上而下和自下而上流动。这将允许自然地将热记录维护在一起,以实现更快的查询和更有效的缓存。其次,将创建新的算法来提高数据合并的速度。定期合并用于维护存储的数据的组织和一致性。 该目标将研究如何普遍分区 LSM 运行,以便于将大型合并拆分为多个不相交的子合并,从而减少停顿期。第三个目标是创建算法以更好地利用大内存大小和多线程并行性,并开发混合内存磁盘 LSM 树。关键思想是,不是直接扩大 MemTable(缓冲最近的写入),而是可以将一些组件固定在内存中,以更有效的组织,并启用查询的并行执行。该项目包括理论分析、实验研究和软件开发。开发的算法在真实世界的数据上进行测试,并集成到真实的数据库系统中。这种整合可能会增加该项目的影响。该奖项反映了 NSF 的法定使命,并且通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parallel Longest Increasing Subsequence and van Emde Boas Trees
并行最长递增子序列和 van Emde Boas 树
  • DOI:
    10.1145/3558481.3591069
  • 发表时间:
    2023-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gu, Yan;Men, Ziyang;Shen, Zheqi;Sun, Yihan;Wan, Zijin
  • 通讯作者:
    Wan, Zijin
Efficient Parallel Output-Sensitive Edit Distance
高效并行输出敏感编辑距离
Parallel Strong Connectivity Based on Faster Reachability
基于更快可达性的并行强连接
Comparison of LSM indexing techniques for storing spatial data
用于存储空间数据的LSM索引技术的比较
  • DOI:
    10.1186/s40537-023-00734-3
  • 发表时间:
    2023-04-23
  • 期刊:
  • 影响因子:
    8.1
  • 作者:
    Qizhong Mao;Mohiuddin Abdul Qader;Vagelis Hristidis
  • 通讯作者:
    Vagelis Hristidis
Efficient Parallel Output-Sensitive Edit Distance
高效并行输出敏感编辑距离
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Evangelos Christidis其他文献

Evangelos Christidis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Evangelos Christidis', 18)}}的其他基金

III: Medium: Efficient Collaborative Perception over Controllable Agent Networks
III:媒介:可控代理网络上的高效协作感知
  • 批准号:
    1901379
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
BIGDATA: F: Collaborative Research: Optimizing Log-Structured-Merge-Based Big Data Management Systems
BIGDATA:F:协作研究:优化基于日志结构合并的大数据管理系统
  • 批准号:
    1838222
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
EAGER: Joint Modeling and Querying of Social Media and Video Data
EAGER:社交媒体和视频数据的联合建模和查询
  • 批准号:
    1746031
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
III-CXT-Small: Information Discovery on Domain Data Graphs
III-CXT-Small:领域数据图上的信息发现
  • 批准号:
    1216032
  • 财政年份:
    2011
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CAREER: A Collaborative Adaptive Data Sharing Platform
职业:协作自适应数据共享平台
  • 批准号:
    1216007
  • 财政年份:
    2011
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
CAREER: A Collaborative Adaptive Data Sharing Platform
职业:协作自适应数据共享平台
  • 批准号:
    0952347
  • 财政年份:
    2010
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
III: Travel Support for US-Based Students to Attend the 2009 IEEE International Conference on Data Mining (ICDM 2009)
III:为美国学生参加 2009 年 IEEE 国际数据挖掘会议 (ICDM 2009) 提供差旅支持
  • 批准号:
    0949134
  • 财政年份:
    2009
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
III-CXT-Small: Information Discovery on Domain Data Graphs
III-CXT-Small:领域数据图上的信息发现
  • 批准号:
    0811922
  • 财政年份:
    2008
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant

相似国自然基金

小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
  • 批准号:
    82371229
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
  • 批准号:
    82301369
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
  • 批准号:
    82371419
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
  • 批准号:
    82303616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134203
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small: Rethinking Virtualization at the Edge to Support Highly-efficient and Low-power Applications
SHF:小型:重新思考边缘虚拟化以支持高效和低功耗应用
  • 批准号:
    2210744
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134202
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: Rethinking Runtime Software Security Hardening in the Context of Hybrid Instruction Set Architecture
CNS 核心:小型:重新思考混合指令集架构背景下的运行时软件安全强化
  • 批准号:
    2127491
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: Rethinking High-Performance Persistent Transactions
CNS 核心:小型:重新思考高性能持久事务
  • 批准号:
    2106117
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了