EAGER: Algorithms for Analyzing Faulty Data Using Domain Information

EAGER:使用域信息分析错误数据的算法

基本信息

  • 批准号:
    2414736
  • 负责人:
  • 金额:
    $ 30万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2024
  • 资助国家:
    美国
  • 起止时间:
    2024-03-01 至 2026-02-28
  • 项目状态:
    未结题

项目摘要

The focus of this project is the building of a mathematical theory for analyzing large data that contains errors by taking advantage of domain knowledge regarding the processes that have created the data, as well as the error model. The project contains three thrusts, listed from the most well-defined to the most exploratory. The first thrust involves analyzing genomic data in order to investigate tumor evolution trees that lead to the development of cancer. The second involves analyzing faulty data generated by computer networks while utilizing information about the network such as its topology and delay pattern. The third is exploring other areas for which the techniques developed for the first two thrusts apply, making progress towards the goal of developing general techniques for analyzing faulty data in the absence of a known ground truth using domain information.In the model that this project assumes, the input contains errors that have been probabilistically generated according to a known distribution in unknown locations. The goal that the investigator would like to explore is the creation of sampling techniques that do not blindly take random samples from the prohibitively large space for the ground truth; rather, it is to use the knowledge about restrictions that limit the possible space that could have led to the noisy input and analyze this much smaller space. In particular, the first focus of this project is to explore how such information can be used to generate efficient sampling techniques in order to infer properties of tumor progression trees, and, later on, more general phylogenetic trees. Later parts of this project involve applying this knowledge to routing graphs and other data with underlying well-structured graphs. Since such techniques rely on graph-theoretic assumptions underlying the inputs, the goal for all three thrusts is to develop widely applicable probabilistic techniques that will help one analyze noisy graph information in general, pushing existing theoretical knowledge forward, as well as bringing a better understanding to applied areas with strong theoretical underpinnings.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目的重点是建立一个数学理论,通过利用有关创建数据的过程以及错误模型的领域知识来分析包含错误的大数据。 该项目包含三个主旨,从最明确的到最具探索性的。 第一个重点涉及分析基因组数据,以研究导致癌症发展的肿瘤进化树。 第二个涉及分析计算机网络生成的错误数据,同时利用有关网络的信息(例如其拓扑和延迟模式)。 第三个是探索前两个主旨开发的技术适用的其他领域,朝着开发在缺乏已知地面事实的情况下使用领域信息分析错误数据的通用技术的目标取得进展。在该项目假设的模型中,输入包含根据未知位置的已知分布概率生成的错误。 研究者想要探索的目标是创建采样技术,这种技术不会盲目地从大得令人望而却步的空间中随机采样以获得地面真相;相反,它是利用有关限制的知识来限制可能导致噪声输入的可能空间,并分析这个小得多的空间。 特别是,该项目的第一个重点是探索如何使用这些信息来生成有效的采样技术,以推断肿瘤进展树的特性,以及随后推断更一般的系统发育树。 该项目的后续部分涉及将这些知识应用于路由图和具有底层结构良好图的其他数据。 由于这些技术依赖于输入背后的图论假设,因此所有三个主旨的目标都是开发广泛适用的概率技术,帮助人们分析一般的噪声图信息,推动现有的理论知识向前发展,并带来更好的理解。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Funda Ergun其他文献

Network design for tolerating multiple link failures using Fast Re-route (FRR)
使用快速重新路由 (FRR) 来容忍多个链路故障的网络设计

Funda Ergun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Funda Ergun', 18)}}的其他基金

IPA increment.
IPA增量。
  • 批准号:
    1940000
  • 财政年份:
    2019
  • 资助金额:
    $ 30万
  • 项目类别:
    Intergovernmental Personnel Award

相似国自然基金

混合关键实时系统中并行任务的调度算法设计与可调度分析方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
对称密码算法差分与线性分析新型理论体系中困难问题研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
P-递归多项式序列的算术理论、符号算法及其在组合分析中的应用
  • 批准号:
    12271511
  • 批准年份:
    2022
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
特征投影分解技术在最优控制模型中的快速算法分析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多维标度分析中若干乘积流形约束矩阵优化问题的可解理论及算法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    29 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Computational Methods for Analyzing lmmunoglobulin Allelic Diversity in B cells
分析 B 细胞中免疫球蛋白等位基因多样性的计算方法
  • 批准号:
    10751541
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
Beyond theta: analyzing oscillations across the frequency spectrum in patients with dystonia implanted with sensing-enabled pulse generators
超越 theta:分析植入传感脉冲发生器的肌张力障碍患者的整个频谱振荡
  • 批准号:
    10569467
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
Analyzing Patient-Level Data in a Breast Cancer Clinical Trial
分析乳腺癌临床试验中的患者水平数据
  • 批准号:
    10720278
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
muMS2: an open source R package for analyzing and integrating multi-omics datasets to improve early detection and understanding of colorectal cancer
muMS2:一个开源 R 包,用于分析和集成多组学数据集,以改善结直肠癌的早期检测和理解
  • 批准号:
    10625394
  • 财政年份:
    2022
  • 资助金额:
    $ 30万
  • 项目类别:
Computational framework for analyzing and annotating single bacterium RNA-Seq data
用于分析和注释单细菌 RNA-Seq 数据的计算框架
  • 批准号:
    10610447
  • 财政年份:
    2022
  • 资助金额:
    $ 30万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了