BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications

BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈

基本信息

  • 批准号:
    1247726
  • 负责人:
  • 金额:
    $ 80万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-02-01 至 2019-01-31
  • 项目状态:
    已结题

项目摘要

Big-data practice suggests that there is a tradeoff between the speed of data ingestion, the ability to answer queries quickly (e.g., via indexing), and the freshness of data. This perceived tradeoff lies, for example, at the heart of the historic division between OLTP (online transaction processing) and OLAP (online analytical processing). In an OLTP database, data gets ingested quickly and the data available for querying is fresh, but analytical queries run prohibitively slowly. In an OLAP data warehouse, data is buffered for off-line indexing so that analytical queries run quickly, but by the time the data gets indexed, it is stale. This tradeoff has manifestations in the design of all types of storage systems. For example, some file-systems are optimized for reads and others for writes, but workloads generally involve a mixture of reads and writes. In this project the PIs show that this is not a fundamental tradeoff, but rather a tradeoff imposed by the choice of data structure. The PIs use write-optimized structures, an alternative to traditional indexing methodologies, to build storage systems in which this tradeoff is significantly mitigated or alleviated altogether. The performance promise of such indexing schemes follows from the PIs previous work establishing that write-optimized data structures can speed up both inserts and queries. This project addresses the remaining obstacles in the deployment of write-optimized indexes within big-data file-systems and databases. Big data imposes a new set of constraints on any storage system, and the PIs will show how write-optimized indexing can yield order-of-magnitude performance improvements at scale. In particular, this project will show that such techniques are not only applicable today but that they will scale with hardware trends, including the widespread adoption of solid-state disks (SSDs).
大数据实践表明,数据摄入速度,快速回答查询的能力(例如,通过索引)和数据新鲜度之间存在权衡。这种感知的权衡在于,例如,OLTP(在线交易处理)和OLAP(在线分析处理)之间的历史性划分的核心。在OLTP数据库中,数据被快速摄入,可用于查询的数据是新鲜的,但是分析性查询的运行缓慢。在OLAP数据仓库中,数据被缓冲以进行离线索引,因此分析查询迅速运行,但是到数据索引时,它已经过时了。这种权衡在所有类型的存储系统的设计中都有表现。例如,某些文件系统已针对读取和其他写入进行了优化,但是工作负载通常涉及读取和写入的混合物。在这个项目中,PIS表明,这不是一个基本的权衡,而是由数据结构的选择所施加的权衡。 PI使用写作优化的结构,是传统索引方法的替代方法,以构建存储系统,在该系统中,这种权衡会大大减轻或完全缓解。此类索引方案的性能承诺遵循PIS先前的工作,确定写优化的数据结构可以加快插入和查询。该项目解决了大数据文件系统和数据库中写入优化索引的剩余障碍。大数据对任何存储系统都施加了一组新的约束,PIS将显示写优化的索引如何在大规模上产生刻板级的性能改进。特别是,该项目将表明,这种技术不仅适用于今天,而且会随硬件趋势的扩展,包括广泛采用固态磁盘(SSD)。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michael Bender其他文献

Turks in Bulgaria and the Netherlands: A comparative study of their acculturation orientations and outcomes
保加利亚和荷兰的土耳其人:他们的文化适应倾向和结果的比较研究
Global perspectives on well-being in immigrant families
关于移民家庭福祉的全球视角
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    R. Dimitrova;Michael Bender;F. Vijver
  • 通讯作者:
    F. Vijver
Assessing the Importance of Internal and External Self-Esteem and Their Relationship to Honor Concerns in Six Countries
评估六个国家内部和外部自尊的重要性及其与尊重问题的关系
  • DOI:
    10.1177/1069397120909383
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Yvette van Osch;Michael Bender;Jia He;B. Adams;Filiz Kunuroglu;Richard N. Tillman;Isabel Benítez;L. Sekaja;Neo Mamathuba
  • 通讯作者:
    Neo Mamathuba
Childhood Context Explains Cultural Variance in Implicit Parenting Motivation: Results from Two Studies with Six Samples from Cameroon,
童年背景解释了内隐养育动机的文化差异:来自喀麦隆六个样本的两项研究的结果,
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Chasiotis;Michael Bender
  • 通讯作者:
    Michael Bender
Personality in Recovered Depressed Elderly
抑郁老人康复后的人格
  • DOI:
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    7
  • 作者:
    Lon S. Schneider;M. Zemansky;Michael Bender;Bruce Sloane
  • 通讯作者:
    Bruce Sloane

Michael Bender的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michael Bender', 18)}}的其他基金

NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
  • 批准号:
    2247577
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
When was Summit, Greenland last ice-free: 81Kr dating of dirty ice at the bottom of the GISP2 ice core
格陵兰岛萨米特最后一次无冰是什么时候:GISP2冰芯底部脏冰的81Kr测年
  • 批准号:
    2052958
  • 财政年份:
    2021
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Medium: Adventures in Flatland: Algorithms for Modern Memories
合作研究:AF:媒介:平地历险记:现代记忆算法
  • 批准号:
    2106827
  • 财政年份:
    2021
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
Collaborative Research: PPoSS: Planning: Efficient Address Translation with Formal Guarantees for Data-Center-Scale Applications
协作研究:PPoSS:规划:有效的地址转换,为数据中心规模的应用程序提供正式保证
  • 批准号:
    2118830
  • 财政年份:
    2021
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
ABR: CSR: Medium: Collaborative Research: FTFS: A Read/Write Optimized Fractal Tree File System
ABR:CSR:媒介:协作研究:FTFS:读/写优化的分形树文件系统
  • 批准号:
    1938709
  • 财政年份:
    2019
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
CCF-BSF: AF: Small: Collaborative Research: The Dictionary Problem Considered
CCF-BSF:AF:小型:协作研究:考虑的字典问题
  • 批准号:
    1716252
  • 财政年份:
    2017
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: FTFS: A Read/Write-Optimized Fractal Tree File System
CSR:媒介:协作研究:FTFS:读/写优化的分形树文件系统
  • 批准号:
    1755615
  • 财政年份:
    2016
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
AF: Small: Collaborative Research: Maintaining Order
AF:小:协作研究:维持秩序
  • 批准号:
    1617618
  • 财政年份:
    2016
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: FTFS: A Read/Write-Optimized Fractal Tree File System
CSR:媒介:协作研究:FTFS:读/写优化的分形树文件系统
  • 批准号:
    1408695
  • 财政年份:
    2014
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
AF: SMALL: Collaborative Research: Data Structures for Parallel Algorithms
AF:小:协作研究:并行算法的数据结构
  • 批准号:
    1217708
  • 财政年份:
    2012
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant

相似国自然基金

大规模网络数据中邻接矩阵特征根与特征向量的研究
  • 批准号:
    12371278
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
非凸随机优化在大规模学习任务中的关键参数探究
  • 批准号:
    62302325
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大规模检验中的经验贝叶斯方法
  • 批准号:
    12371282
  • 批准年份:
    2023
  • 资助金额:
    44.00 万元
  • 项目类别:
    面上项目
面向超级计算机的改进粒子群算法在大规模WSN中的应用研究
  • 批准号:
    62372495
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
新型电力系统中可再生能源大规模利用的建模及激励机制研究
  • 批准号:
    72304114
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
  • 批准号:
    1560625
  • 财政年份:
    2015
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
  • 批准号:
    1502780
  • 财政年份:
    2014
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
  • 批准号:
    8840914
  • 财政年份:
    2013
  • 资助金额:
    $ 80万
  • 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
  • 批准号:
    1247469
  • 财政年份:
    2013
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing
大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言
  • 批准号:
    1416259
  • 财政年份:
    2013
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了