Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage

合作研究:CIF:小型:分子存储中的编码串重建问题

基本信息

  • 批准号:
    2007238
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

The problem of reconstructing text strings from their fragments or masses of fragments is of focal importance in computational biology as current DNA and protein sequencing platforms are unable to read the content of long strings that denote protein/gene sequences. One prototypical example of string reconstruction arises in DNA assembly: there, one creates multiple copies of the same long string and cuts the copies to read out short overlapping substrings that can be put together by matching their prefixes and suffixes. The reconstructed string may not be a perfect replica of the original string due to errors in the fragmentation and matching processes. Furthermore, for many strings unique reconstruction is inherently impossible. This represents a major issue for next generation sequencing technologies used in fundamental biological research, since in this setting it is impossible to ensure unambiguous results. The successful code designs pursued in this project can resolve reliability and content retrieval issues impeding implementations of emerging molecular computing and storage paradigms. This project is concerned with developing novel coding methods for unique reconstruction of strings or pools of strings based on their constituent substrings, subsequences and substring compositions. The techniques employed represent a combination of new graph-theoretic, combinatorial optimization and information theory approaches. In particular, the project will investigate the use of balanced partial de Bruijn strings for substring-based reconstruction, Catalan-like paths for multiset composition reconstruction as well as coded multi-trace reconstruction methods involving specialized modifications of deletion-correcting codes and superposition codes. The coding schemes will be tested on DNA-based and synthetic polymer-based data storage platforms under the development at the University of Illinois.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
从片段或大量片段​​重建文本字符串的问题在计算生物学中至关重要,因为当前的 DNA 和蛋白质测序平台无法读取表示蛋白质/基因序列的长字符串的内容。字符串重建的一个典型例子出现在 DNA 组装中:在那里,人们创建同一长字符串的多个副本,并剪切副本以读出短的重叠子字符串,这些子字符串可以通过匹配其前缀和后缀来组合在一起。由于分段和匹配过程中的错误,重建的字符串可能不是原始字符串的完美复制品。此外,对于许多弦来说,唯一的重建本质上是不可能的。这对于基础生物学研究中使用的下一代测序技术来说是一个主要问题,因为在这种情况下不可能确保明确的结果。该项目所追求的成功代码设计可以解决阻碍新兴分子计算和存储范例实现的可靠性和内容检索问题。该项目致力于开发新颖的编码方法,用于基于字符串或字符串池的组成子串、子序列和子串组合来进行独特的重建。所采用的技术代表了新的图论、组合优化和信息论方法的组合。特别是,该项目将研究使用平衡部分 de Bruijn 字符串进行基于子串的重建,使用类似加泰罗尼亚语的路径进行多集组合重建,以及涉及删除校正码和叠加码的专门修改的编码多迹重建方法。这些编码方案将在伊利诺伊大学开发的基于 DNA 和合成聚合物的数据存储平台上进行测试。该奖项反映了 NSF 的法定使命,并通过利用基金会的智力优势和更广泛的影响进行评估,被认为值得支持。审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wojciech Szpankowski其他文献

Average redundancy rate of the Lempel-Ziv code
Lempel-Ziv码的平均冗余率
Combinatorial optimization problems for which almost every algorithm is asymptotically optimal
几乎所有算法都是渐近最优的组合优化问题
  • DOI:
  • 发表时间:
    1995
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski
THE CONCENTRATION OF THE MAXIMUM DEGREE 1 IN THE DUPLICATION-DIVERGENCE MODELS
重复发散模型中最大度1的集中度
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Frieze;K. Turowski;Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski
Project-Team Hipercom HIgh PERformance COMmunication
Hipercom 高性能通信项目团队
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philippe Jacquet;Wojciech Szpankowski;C. Adjih;Géraud Allard;E. Baccelli;P. Mühlethaler
  • 通讯作者:
    P. Mühlethaler
Algorithms and Data Structures
算法和数据结构
  • DOI:
    10.1017/cbo9780511843204.009
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philippe Jacquet;Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski

Wojciech Szpankowski的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wojciech Szpankowski', 18)}}的其他基金

CCF: Medium: Learning From Classical and Quantum Data: a Fourier Perspective
CCF:媒介:从经典和量子数据中学习:傅里叶视角
  • 批准号:
    2211423
  • 财政年份:
    2022
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF:Small: Towards Information Content of Dynamic Structures
CIF:Small:走向动态结构的信息内容
  • 批准号:
    2006440
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Towards Structural Information
CIF:小:走向结构信息
  • 批准号:
    1524312
  • 财政年份:
    2015
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Emerging Frontiers of Science of Information
信息科学的新兴前沿
  • 批准号:
    0939370
  • 财政年份:
    2010
  • 资助金额:
    $ 25万
  • 项目类别:
    Cooperative Agreement
Collaborative Research: Information Theory of Data Structures
合作研究:数据结构信息论
  • 批准号:
    0830140
  • 财政年份:
    2008
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Information Transfer in Biological Systems
生物系统中的信息传输
  • 批准号:
    0800568
  • 财政年份:
    2008
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: Nonlinear Equations Arising in Information Theory and Computer Sciences
合作研究:信息论和计算机科学中出现的非线性方程
  • 批准号:
    0503742
  • 财政年份:
    2005
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Crossroads of Information Theory and Computer Science: Analytic Algorithmics, Combinatorics, and Information Theory
信息论和计算机科学的十字路口:分析算法、组合学和信息论
  • 批准号:
    0513636
  • 财政年份:
    2005
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Information Theory and Computer Science Interface
信息论与计算机科学接口
  • 批准号:
    0321451
  • 财政年份:
    2003
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Analytic Information Theory, Combinatorics, and Algorithmics: The Precise Redundancy and Related Problems
分析信息论、组合学和算法:精确冗余及相关问题
  • 批准号:
    0208709
  • 财政年份:
    2002
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant

相似国自然基金

IGF-1R调控HIF-1α促进Th17细胞分化在甲状腺眼病发病中的机制研究
  • 批准号:
    82301258
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CTCFL调控IL-10抑制CD4+CTL旁观者激活促口腔鳞状细胞癌新辅助免疫治疗抵抗机制研究
  • 批准号:
    82373325
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
RNA剪接因子PRPF31突变导致人视网膜色素变性的机制研究
  • 批准号:
    82301216
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
血管内皮细胞通过E2F1/NF-kB/IL-6轴调控巨噬细胞活化在眼眶静脉畸形中的作用及机制研究
  • 批准号:
    82301257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于多元原子间相互作用的铝合金基体团簇调控与强化机制研究
  • 批准号:
    52371115
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
  • 批准号:
    2403123
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了