CRII: CIF: Towards Linear-Time Computation of Structured Data Representations

CRII:CIF:走向结构化数据表示的线性时间计算

基本信息

  • 批准号:
    1566281
  • 负责人:
  • 金额:
    $ 17.33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-04-15 至 2019-03-31
  • 项目状态:
    已结题

项目摘要

Estimating an unknown object from noisy, nonlinear, and incomplete observations constitutes a basic problem in data science. Standard solutions first assume that the unknown object obeys a structured mathematical representation, and then develop optimization algorithms for recovering the parameters of the representation. Moreover, rigorous analysis reveals that several such algorithms are statistically optimal. However, despite these advances in statistical understanding, the role of computation is far less well understood; in many cases, even the best methods incur a computation time proportional to a high-degree polynomial in terms of the data size. Therefore, to reap the full benefits of these methods in applications involving massive data, new algorithmic approaches are necessary. This research project introduces new theory and computational tools for learning structured data representations in linear running time. The new algorithmic approaches are based on the intuition that challenging optimization problems encountered in data analysis can be circumvented if the answers are merely approximate, rather than exact. Establishing precise tradeoffs between statistical performance, approximation quality, and running time is a key focus. With this intuition, the project addresses three specific problems: (i) Reconstructing signals and images from nonlinear observations. (ii) Recovering graphs from partial observations, such as linear sketches or inter-node distance measurements. (iii) Estimating multidimensional probability distributions from random samples. Algorithms developed within the scope of the project impact applications ranging from medical imaging, computer network monitoring, social network analysis, and non-destructive evaluation (NDE). All publications, data, and source code are publicly available. The project involves the active participation of both graduate and undergraduate students, and exposes them to a span of areas including mathematics, statistics, computer science, and optimization.
从噪声、非线性和不完整的观测中估计未知物体是数据科学中的一个基本问题。标准解决方案首先假设未知对象遵循结构化数学表示,然后开发优化算法来恢复表示的参数。此外,严格的分析表明,几种此类算法在统计上是最佳的。然而,尽管统计理解取得了这些进展,但计算的作用却远未得到充分理解。在许多情况下,即使是最好的方法也会产生与数据大小的高次多项式成比例的计算时间。因此,为了在涉及海量数据的应用中充分发挥这些方法的优势,需要新的算法方法。该研究项目引入了用于在线性运行时间内学习结构化数据表示的新理论和计算工具。新的算法方法基于这样的直觉:如果答案只是近似的而不是精确的,则可以规避数据分析中遇到的具有挑战性的优化问题。在统计性能、近似质量和运行时间之间建立精确的权衡是一个关键焦点。凭借这种直觉,该项目解决了三个具体问题:(i)从非线性观测中重建信号和图像。 (ii) 从部分观察中恢复图形,例如线性草图或节点间距离测量。 (iii) 估计随机样本的多维概率分布。该项目范围内开发的算法影响医学成像、计算机网络监控、社交网络分析和无损评估 (NDE) 等应用。所有出版物、数据和源代码都是公开的。该项目吸引了研究生和本科生的积极参与,让他们接触到数学、统计学、计算机科学和优化等多个领域。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chinmay Hegde其他文献

Exploring Dataset-Scale Indicators of Data Quality
探索数据集规模的数据质量指标
  • DOI:
    10.48550/arxiv.2311.04016
  • 发表时间:
    2023-11-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ben Feuer;Chinmay Hegde
  • 通讯作者:
    Chinmay Hegde
Arboretum: A Large Multimodal Dataset Enabling AI for Biodiversity
Arboretum:一个大型多模式数据集,支持人工智能促进生物多样性
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chih;Ben Feuer;Zaki Jubery;Zi K. Deng;Andre Nakkab;Md Zahid Hasan;Shivani Chiranjeevi;Kelly O. Marshall;Nirmal Baishnab;Asheesh K. Singh;Arti Singh;Soumik Sarkar;Nirav C. Merchant;Chinmay Hegde;B. Ganapathysubramanian
  • 通讯作者:
    B. Ganapathysubramanian
TuneTables: Context Optimization for Scalable Prior-Data Fitted Networks
TuneTables:可扩展先验数据拟合网络的上下文优化
  • DOI:
    10.48550/arxiv.2402.11137
  • 发表时间:
    2024-02-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ben Feuer;R. Schirrmeister;Valeriia Cherepanova;Chinmay Hegde;Frank Hutter;Micah Goldblum;Niv Cohen;Colin White
  • 通讯作者:
    Colin White
Towards Foundational AI Models for Additive Manufacturing: Language Models for G-Code Debugging, Manipulation, and Comprehension
迈向增材制造的基础 AI 模型:用于 G 代码调试、操作和理解的语言模型
  • DOI:
    10.48550/arxiv.2309.02465
  • 发表时间:
    2023-09-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anushrut Jignasu;Kelly O. Marshall;B. Ganapathysubramanian;Aditya Balu;Chinmay Hegde;A. Krishnamurthy
  • 通讯作者:
    A. Krishnamurthy
Agnostic Active Learning of Single Index Models with Linear Sample Complexity
具有线性样本复杂度的单指标模型的不可知主动学习

Chinmay Hegde的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chinmay Hegde', 18)}}的其他基金

EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Medium: An Incident-Response Approach for Empowering Fact-Checkers
协作研究:SaTC:核心:媒介:增强事实检查人员能力的事件响应方法
  • 批准号:
    2154119
  • 财政年份:
    2022
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
CAREER: Advances in Graph Learning and Inference
职业:图学习和推理的进展
  • 批准号:
    2005804
  • 财政年份:
    2019
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Continuing Grant
CAREER: Advances in Graph Learning and Inference
职业:图学习和推理的进展
  • 批准号:
    1750920
  • 财政年份:
    2018
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Continuing Grant

相似国自然基金

SHR和CIF协同调控植物根系凯氏带形成的机制
  • 批准号:
    31900169
  • 批准年份:
    2019
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CIF: Small: Towards a Control Framework for Neural Generative Modeling
CIF:小:走向神经生成建模的控制框架
  • 批准号:
    2348624
  • 财政年份:
    2024
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
CRII:CIF: Towards A Manifold-based Framework for the Brain-Computer Interface
CRII:CIF:迈向基于流形的脑机接口框架
  • 批准号:
    2153492
  • 财政年份:
    2022
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
CRII: CIF: Machine Learning Based Equalization Towards Multitrack Synchronization and Detection in Two-Dimensional Magnetic Recording
CRII:CIF:基于机器学习的均衡,实现二维磁记录中的多轨同步和检测
  • 批准号:
    2105092
  • 财政年份:
    2021
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
CIF:Small: Towards Information Content of Dynamic Structures
CIF:Small:走向动态结构的信息内容
  • 批准号:
    2006440
  • 财政年份:
    2020
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
CIF: Small: Towards Robust Statistical Learning: Theory and Algorithms
CIF:小:迈向稳健的统计学习:理论和算法
  • 批准号:
    1908905
  • 财政年份:
    2019
  • 资助金额:
    $ 17.33万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了