CAREER: Large-Scale Markov Chain Monte Carlo for Reliable Machine Learning
职业:用于可靠机器学习的大规模马尔可夫链蒙特卡罗
基本信息
- 批准号:2046760
- 负责人:
- 金额:$ 42.21万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-03-15 至 2026-02-28
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
A core capability of intelligence is reasoning about hidden information. Many artificial intelligence (AI) approaches reason about hidden information by constructing a statistical model and then running a statistical inference algorithm to learn hidden information from observed data. But many inference algorithms take a very long time to run when they are learning from a very large amount of data; or, worse, they might run quickly but give the wrong answer. This is problematic as the world trends towards large-scale AI. This project will build new general statistical inference algorithms that will still run efficiently, even on very large datasets and on very complicated models, while having provable reliability guarantees. This will promote the progress of science by making scalable statistical inference reliable. The project will also further education in AI through the development of open-source course resources that give students hands-on experience with how scalability and reliability interact in ML systems.The project will focus on Markov chain Monte Carlo (MCMC) methods, which is a class of statistical inference algorithm that work by simulating a random process that converges to a desired statistical model. Markov chain Monte Carlo methods can give very accurate statistical estimates, but can scale poorly to large datasets and complicated models. This project will fix this by building new algorithms that address scaling to large data and large models with data-subsampling and asynchronous parallelism, respectively. Throughout, it will focus on proving theoretical guarantees that expose the trade-off between scalability and reliability for MCMC.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
情报的核心能力是对隐藏信息的推理。许多人工智能 (AI) 方法通过构建统计模型,然后运行统计推理算法来从观察到的数据中学习隐藏信息,从而推理隐藏信息。但许多推理算法在从大量数据中学习时需要很长时间才能运行;或者,更糟糕的是,他们可能跑得很快,但却给出了错误的答案。随着世界走向大规模人工智能,这是一个问题。该项目将构建新的通用统计推理算法,即使在非常大的数据集和非常复杂的模型上,该算法仍然可以高效运行,同时具有可证明的可靠性保证。这将使可扩展的统计推断变得可靠,从而促进科学的进步。该项目还将通过开发开源课程资源来进一步开展人工智能教育,让学生亲身体验机器学习系统中的可扩展性和可靠性如何相互作用。该项目将重点关注马尔可夫链蒙特卡罗 (MCMC) 方法,该方法是一类统计推断算法,通过模拟收敛到所需统计模型的随机过程来工作。马尔可夫链蒙特卡罗方法可以给出非常准确的统计估计,但对于大型数据集和复杂模型的扩展性较差。该项目将通过构建新的算法来解决这个问题,这些算法分别通过数据二次采样和异步并行来解决大数据和大模型的扩展问题。自始至终,它将侧重于证明揭示 MCMC 可扩展性和可靠性之间权衡的理论保证。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A General Analysis of Example-Selection for Stochastic Gradient Descent
随机梯度下降算例选择的一般分析
- DOI:
- 发表时间:2024-09-14
- 期刊:
- 影响因子:0
- 作者:Yucheng Lu;S. Meng;Christopher De Sa
- 通讯作者:Christopher De Sa
Low-Precision Stochastic Gradient Langevin Dynamics
低精度随机梯度 Langevin Dynamics
- DOI:10.48550/arxiv.2206.09909
- 发表时间:2022-06-20
- 期刊:
- 影响因子:0
- 作者:Ruqi Zhang;A. Wilson;Chris De Sa
- 通讯作者:Chris De Sa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Christopher De Sa其他文献
Understanding Accuracy-Efficiency Trade-Offs as a Means for Holding Distributed ML Systems Accountable
了解准确性与效率的权衡作为让分布式机器学习系统承担责任的一种手段
- DOI:
- 发表时间:
2024-09-14 - 期刊:
- 影响因子:0
- 作者:
A. Feder Cooper;K. Levy;Christopher De Sa - 通讯作者:
Christopher De Sa
Accuracy-Efficiency Trade-Offs and Accountability in Distributed ML Systems
分布式机器学习系统中的准确性-效率权衡和责任
- DOI:
10.1145/3465416.3483289 - 发表时间:
2020-07-04 - 期刊:
- 影响因子:0
- 作者:
A. Feder Cooper;K. Levy;Christopher De Sa - 通讯作者:
Christopher De Sa
Holding Real-Time Distributed ML Systems to Account
将实时分布式机器学习系统记入账户
- DOI:
- 发表时间:
2020-07-04 - 期刊:
- 影响因子:0
- 作者:
A. Feder Cooper;K. Levy;Christopher De Sa - 通讯作者:
Christopher De Sa
‘Tecnologica cosa’: Modeling Storyteller Personalities in Boccaccio’s ‘Decameron’
“Tecnologica cosa”:塑造薄伽丘《十日谈》中讲故事者的个性
- DOI:
10.18653/v1/2021.latechclfl-1.17 - 发表时间:
2021-09-22 - 期刊:
- 影响因子:0
- 作者:
A. Feder Cooper;Maria Antoniak;Christopher De Sa;Marilyn Migiel;David M. Mimno - 通讯作者:
David M. Mimno
High-Accuracy Low-Precision Training
高精度低精度训练
- DOI:
- 发表时间:
2018-03-09 - 期刊:
- 影响因子:0
- 作者:
Christopher De Sa;Megan Leszczynski;Jian Zhang;Alana Marzoev;Christopher R. Aberger;K. Olukotun;C. Ré - 通讯作者:
C. Ré
Christopher De Sa的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Christopher De Sa', 18)}}的其他基金
RI: Small: Reliable Machine Learning in Hyperbolic Spaces
RI:小型:双曲空间中的可靠机器学习
- 批准号:
2008102 - 财政年份:2020
- 资助金额:
$ 42.21万 - 项目类别:
Standard Grant
相似国自然基金
含规模化新能源接入的交直流大电网动态无功储备评估“时间-空间-优化”降维等值方法研究
- 批准号:
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:
面向科学大装置超大规模数据流的定制计算研究
- 批准号:
- 批准年份:2020
- 资助金额:50 万元
- 项目类别:联合基金项目
面向大规模盲源分离的高维度大尺寸张量分解方法研究
- 批准号:62071082
- 批准年份:2020
- 资助金额:54 万元
- 项目类别:面上项目
利用Cas9大规模基因敲除技术在HIV-1潜伏细胞上筛选及鉴定与HIV潜伏相关的关键宿主基因
- 批准号:31771484
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
CAREER: Theoretical foundations for deep learning and large-scale AI models
职业:深度学习和大规模人工智能模型的理论基础
- 批准号:
2339904 - 财政年份:2024
- 资助金额:
$ 42.21万 - 项目类别:
Continuing Grant
CAREER: Novel Parallelization Frameworks for Large-Scale Network Optimization with Combinatorial Requirements: Solution Methods and Applications
职业:具有组合要求的大规模网络优化的新型并行化框架:解决方法和应用
- 批准号:
2338641 - 财政年份:2024
- 资助金额:
$ 42.21万 - 项目类别:
Standard Grant
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
- 批准号:
2339112 - 财政年份:2024
- 资助金额:
$ 42.21万 - 项目类别:
Continuing Grant
CAREER: A Multi-faceted Framework to Enable Computationally Efficient Evaluation and Automatic Design for Large-scale Economics-driven Transmission Planning
职业生涯:一个多方面的框架,可实现大规模经济驱动的输电规划的计算高效评估和自动设计
- 批准号:
2339956 - 财政年份:2024
- 资助金额:
$ 42.21万 - 项目类别:
Continuing Grant
CAREER: Learning Theory for Large-scale Stochastic Games
职业:大规模随机博弈的学习理论
- 批准号:
2339240 - 财政年份:2024
- 资助金额:
$ 42.21万 - 项目类别:
Continuing Grant