CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms

CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法

基本信息

项目摘要

Part 1: Coding for distributed storage systems has garnered significant attention in the past few years due to the rapid development of information technologies and the emergence of Big Data formats that need to be stored and disseminated across large-scale networks. As typical distributed systems need to ensure low-latency data access and store a large number of files over a set of nodes connected through a communication network, it is imperative to develop new distributed coding schemes that protect the systems from undesired component failures. The two key functionalities of codes used in distributed systems, namely the reconstruction of files via access to a subset of the nodes and repair of failed nodes, need to be retained when the files are accessed and processed by the users via symbol/block insertion, deletion, or substitution edits. Deletions frequently arise due to system-level data deduplication: when parts of files are deduplicated or edited, the changes in the information content need to be communicated to the redundant storage nodes with minimum communication cost. Current solutions for synchronizing data that underwent edits assume that data is uncoded and they do not fully exploit the distributed nature of information. Furthermore, they mostly ignore the presence of deduplication protocols. This makes distributed storage architectures inefficient in terms of storage, user access times, and error protection. Hence, the goals of the proposed research program are to develop a new set of protocols and coding schemes that will support a new generation of versatile and updatable coded distributed storage systems. Part 2: Building on the preliminary work of the investigators, this proposal aims to set the foundations of the new field of coded synchronization and deduplication, with the goal of deriving fundamental performance limits, developing efficient algorithmic solutions for the two families of problems, and constructing new distributed storage codes that enable synchronization of coded data and coded deduplication. In particular, the proposal addresses the following comprehensive issues: 1) Characterizing the communication rate limits of known and new (un)coded synchronization schemes, trade-offs between deduplication and data repair performance for different structured or encoded data formats and different types of communication channels.2) Introducing and analyzing the communication rate-distortion (CRD) function for approximate synchronization and deduplication of structured/encoded data, with a special focus on delay-sensitive applications.3) Developing dynamically updatable synchronization and deduplication algorithms cognizant of the network topology and of different prioritization needs of the users, as encountered in image and video data coding.
第1部分:由于信息技术的快速发展以及需要在大型网络中存储和传播的大数据格式的出现,在过去几年中,编码分布式存储系统在过去几年中引起了极大的关注。由于典型的分布式系统需要确保低延迟数据访问并在通过通信网络连接的一组节点上存储大量文件,因此必须开发保护系统免受不受欢迎组件故障的新分布式编码方案。分布式系统中使用的代码的两个关键功能,即通过访问节点的子集的重建文件和失败节点的维修,当用户通过符号/块插入,删除或替换编辑访问文件和处理时,需要保留文件。由于系统级数据的重复数据删除,经常出现删除:当文件的部分重复编辑或编辑时,信息内容的更改需要将其传达给具有最低通信成本的冗余存储节点。当前用于同步数据的解决方案假定数据未编码,并且没有完全利用信息的分布性质。此外,它们主要忽略了重复数据删除协议的存在。这使得分布式存储架构在存储,用户访问时间和错误保护方面效率低下。因此,拟议的研究计划的目标是制定一套新的协议和编码方案,这些方案将支持新一代的多功能和可更新的编码分布式存储系统。第2部分:基于调查人员的初步工作,该提案旨在为编码同步和重复数据删除的新领域设定基础,目的是得出基本的性能限制,为问题的两个家族开发有效的算法解决方案,并为两个问题家族开发有效的算法解决方案,并为构建编码数据和编码图的新分布式存储代码,并构建新的分布式存储代码。特别是,该提案解决了以下全面问题:1)表征已知和新的(未编码的)编码同步方案的沟通速率限制,针对不同结构化或编码的数据格式的重复数据修复和数据修复性能之间的权衡以及不同类型的通信通道。2)介绍和分析了通信速率(CRD)的构建和DEDARITY(CRD)的构建和分析,以构建近似构建和DESTIADE(CRD)效应,并在近似构建范围内进行同步的构建范围。 3)如图像和视频数据编码中所遇到的那样,开发动态更新的同步和重复数据删除算法,以及用户的不同优先级需求。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Olgica Milenkovic其他文献

On the generalized Hamming weight enumerators and coset weight distributions of even isodual codes
关于偶等对码的广义汉明权重枚举器和陪集权重分布
Detection and Mapping of dsDNA Breaks using Graphene Nanopore Transistor
  • DOI:
    10.1016/j.bpj.2018.11.1580
  • 发表时间:
    2019-02-15
  • 期刊:
  • 影响因子:
  • 作者:
    Nagendra Athreya;Olgica Milenkovic;Jean-Pierre Leburton
  • 通讯作者:
    Jean-Pierre Leburton
Query-based selection of optimal candidates under the Mallows model
  • DOI:
    10.1016/j.tcs.2023.114206
  • 发表时间:
    2023-11-10
  • 期刊:
  • 影响因子:
  • 作者:
    Xujun Liu;Olgica Milenkovic;George V. Moustakides
  • 通讯作者:
    George V. Moustakides

Olgica Milenkovic的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Olgica Milenkovic', 18)}}的其他基金

Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402815
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Group testing for Real-Time Polymerase Chain Reactions: From Primer Selection to Amplification Curve Analysis
合作研究:CIF:中:实时聚合酶链式反应的分组测试:从引物选择到扩增曲线分析
  • 批准号:
    2107344
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage
合作研究:CIF:小型:分子存储中的编码串重建问题
  • 批准号:
    2008125
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: New Methods for Learning on Hypergraphs for Single-Cell Chromatin Data Analysis
合作研究:CIF:Medium:用于单细胞染色质数据分析的超图学习新方法
  • 批准号:
    1956384
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research:Leveraging Data Popularity in Distributed Storage Systems via Constrained Design Theory
CIF:小型:协作研究:通过约束设计理论利用分布式存储系统中的数据流行度
  • 批准号:
    1816913
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SemiSynBio: An On-Chip Nanoscale Storage System Using Chimeric DNA
SemiSynBio:使用嵌合 DNA 的片上纳米级存储系统
  • 批准号:
    1807526
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CIF: Small: Coding for DNA-Based Storage Systems
CIF:小型:基于 DNA 的存储系统的编码
  • 批准号:
    1618366
  • 财政年份:
    2016
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
  • 批准号:
    1527636
  • 财政年份:
    2015
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: A General Theory of Group Testing for Genotyping
CIF:小型:协作研究:基因分型群体测试的一般理论
  • 批准号:
    1218764
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Nonlinear Matrix and Tensor Completion with Applications in Systems Biology
CIF:小:非线性矩阵和张量补全及其在系统生物学中的应用
  • 批准号:
    1117980
  • 财政年份:
    2011
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
  • 批准号:
    61661005
  • 批准年份:
    2016
  • 资助金额:
    30.0 万元
  • 项目类别:
    地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
  • 批准号:
    61301143
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
  • 批准号:
    81072465
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基于小世界网络的传感器网络研究
  • 批准号:
    60472059
  • 批准年份:
    2004
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Acoustic-Optic Vision - Combining Ultrasonic Sonars with Visible Sensors for Robust Machine Perception
合作研究:CIF:Small:声光视觉 - 将超声波声纳与可见传感器相结合,实现强大的机器感知
  • 批准号:
    2326905
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Fisher-Inspired Approach to Quickest Change Detection for Score-Based Models
合作研究:CIF:Small:Fisher 启发的基于评分模型的最快变化检测方法
  • 批准号:
    2334898
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Fisher-Inspired Approach to Quickest Change Detection for Score-Based Models
合作研究:CIF:Small:Fisher 启发的基于评分模型的最快变化检测方法
  • 批准号:
    2334897
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了