Collaborative Research: Statistical Optimal Transport in High Dimensional Mixtures

合作研究:高维混合物中的统计最优传输

基本信息

  • 批准号:
    2210583
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-07-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

This project studies high-dimensional mixture models, a class of statistical models that can be used to analyze data arising in linguistics, computational biology, and particle physics. This research project aims to define a new measure of distance between distributions that measures their similarity with respect to a mixture model and offers a principled way to compare, transform, and analyze high-dimensional data sets. As part of this project, the investigators will develop fast algorithms for estimating this distance and theoretical guarantees allowing this distance to be used for statistical inference.Specifically, this project defines a sketched Wasserstein distance (SWD) and will develop its computational and statistical properties. The primary aims are to establish duality relations for this distance, develop computationally feasible estimators for SWD using both primal and dual formulations, and to study the rates of convergence of the new estimators. In addition, the research aims to develop lower bounds to establish the rate optimality of these estimators and establish distributional limits to allow for the construction of asymptotically valid confidence intervals. These tools will be applied to data in text analysis, systems biology, and high-energy physics.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目研究高维混合模型,这是一类统计模型,可用于分析语言学、计算生物学和粒子物理学中产生的数据。该研究项目旨在定义一种新的分布之间的距离度量,以测量它们相对于混合模型的相似性,并提供一种比较、转换和分析高维数据集的原则方法。作为该项目的一部分,研究人员将开发快速算法来估计该距离,并提供理论保证,使该距离可用于统计推断。具体来说,该项目定义了草图 Wasserstein 距离 (SWD),并将开发其计算和统计特性。主要目标是建立该距离的对偶关系,使用原始公式和对偶公式开发计算上可行的 SWD 估计器,并研究新估计器的收敛率。此外,该研究旨在开发下限来建立这些估计量的速率最优性,并建立分布限制以允许构建渐近有效的置信区间。这些工具将应用于文本分析、系统生物学和高能物理学中的数据。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jonathan Niles-Weed其他文献

Jonathan Niles-Weed的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jonathan Niles-Weed', 18)}}的其他基金

CAREER: Statistical foundations of particle tracking and trajectory inference
职业:粒子跟踪和轨迹推断的统计基础
  • 批准号:
    2339829
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Statistical Estimation from Decoupled Data
根据解耦数据进行统计估计
  • 批准号:
    2015291
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Statistical Estimation from Decoupled Data
根据解耦数据进行统计估计
  • 批准号:
    2015291
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
  • 批准号:
    82304250
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于FAST观测的重复快速射电暴的统计和演化研究
  • 批准号:
    12303042
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
黄河流域城市大气污染和生态韧性时空演变及空间统计关系研究
  • 批准号:
    12361108
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目
复发事件纵向数据的统计分析方法及应用研究
  • 批准号:
    82373679
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
潜在威胁小行星热物理特性统计特征研究
  • 批准号:
    12303066
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Urban Vector-Borne Disease Transmission Demands Advances in Spatiotemporal Statistical Inference
合作研究:城市媒介传播疾病传播需要时空统计推断的进步
  • 批准号:
    2414688
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Collaborative Research: Statistical mechanics of dense suspensions - dynamical correlations and scaling theory
合作研究:稠密悬浮液的统计力学 - 动力学相关性和标度理论
  • 批准号:
    2228681
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: IMR: MM-1A: Scalable Statistical Methodology for Performance Monitoring, Anomaly Identification, and Mapping Network Accessibility from Active Measurements
合作研究:IMR:MM-1A:用于性能监控、异常识别和主动测量映射网络可访问性的可扩展统计方法
  • 批准号:
    2319593
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Differentially Private Data Synthesis: Practical Algorithms and Statistical Foundations
协作研究:SaTC:核心:小型:差分隐私数据合成:实用算法和统计基础
  • 批准号:
    2247795
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Collaborative Research: Enabling Hybrid Methods in the NIMBLE Hierarchical Statistical Modeling Platform
协作研究:在 NIMBLE 分层统计建模平台中启用混合方法
  • 批准号:
    2332442
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了