MCS: AF: Small: Algorithms for Large Scale Prediction Problems
MCS:AF:小型:大规模预测问题的算法
基本信息
- 批准号:1115788
- 负责人:
- 金额:$ 35万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-07-15 至 2015-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In large scale prediction problems that arise in many application areas, data is plentiful, and it is computational resources that constrain the performance of prediction methods. The broad goal of this research project is the design and analysis of methods for large scale prediction problems that make effective use of limited computational resources. The main aims are: to improve our understanding of the tradeoff between the accuracy of a prediction method and its computational requirements; to develop model selection methods that adaptively choose the model complexity to give the best predictive accuracy for the available computational resources; to improve our understanding of the difficulty of solving large scale prediction problems using distributed computational resources; to develop analysis techniques and methods for asynchronous online prediction, which exploit the flexibility to respond to queries out of order; and hence to develop effective methods for large scale prediction problems.As data acquisition and storage has become cheaper, enormous data sets have become available in many areas, including web information retrieval, the biological, medical, and physical sciences, manufacturing, finance and retail. Consequently, for many statistical prediction problems, the amount of data available is so huge that we can treat it as unlimited. For instance, in using image and caption data to train a prediction rule that can automatically choose appropriate labels for images, the web provides an effectively unlimited supply of training data. Similar situations arise in using click stream data to predict the choices of visitors to a popular web site, or in using customers' ratings of movies to make useful recommendations. For these large scale prediction problems, the bottleneck to performance is not the amount of data, rather it is the computational resources that are available. Many modern prediction methods have been designed and analyzed from the perspective that data is precious: they aim for optimal predictive accuracy for a given sample size. But for large scale problems, this is the wrong perspective; computation is the precious resource that must be used wisely. This shift in perspective introduces some novel tradeoffs. One of the most important tradeoffs arises in choosing the complexity of a prediction rule. Should we use our computational resources trying to optimize over a very complex family of prediction rules, which would not allow us to gather much data? Or should we save computation by using simpler prediction rules, and instead spend this computation on gathering more data? This research project is aimed at improving our understanding of these tradeoffs, and hence developing strategies for large scale prediction problems that best exploit the available computational resources.
在许多应用领域出现的大规模预测问题中,数据是丰富的,而计算资源限制了预测方法的性能。 该研究项目的总体目标是设计和分析大规模预测问题的方法,有效利用有限的计算资源。主要目标是:提高我们对预测方法的准确性与其计算要求之间的权衡的理解;开发模型选择方法,自适应地选择模型复杂性,从而为可用计算资源提供最佳的预测精度;提高我们对使用分布式计算资源解决大规模预测问题的难度的理解;开发异步在线预测的分析技术和方法,利用响应无序查询的灵活性;从而开发针对大规模预测问题的有效方法。随着数据采集和存储变得越来越便宜,许多领域都可以使用大量数据集,包括网络信息检索、生物、医学和物理科学、制造、金融和零售。 因此,对于许多统计预测问题,可用的数据量非常巨大,我们可以将其视为无限的。例如,在使用图像和标题数据来训练可以自动为图像选择适当标签的预测规则时,网络实际上提供了无限的训练数据供应。 使用点击流数据来预测流行网站的访问者的选择,或者使用客户对电影的评级来提出有用的推荐时,也会出现类似的情况。 对于这些大规模预测问题,性能的瓶颈不是数据量,而是可用的计算资源。 许多现代预测方法都是从数据宝贵的角度进行设计和分析的:它们的目标是在给定的样本量下获得最佳的预测精度。但对于大规模问题,这是错误的观点;计算是必须明智使用的宝贵资源。这种观点的转变引入了一些新颖的权衡。最重要的权衡之一是选择预测规则的复杂性。我们是否应该使用我们的计算资源来尝试优化一系列非常复杂的预测规则,因为这不允许我们收集大量数据? 或者我们应该通过使用更简单的预测规则来节省计算,而不是将这些计算用于收集更多数据? 该研究项目旨在提高我们对这些权衡的理解,从而制定能够最好地利用可用计算资源的大规模预测问题的策略。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Peter Bartlett其他文献
Mathematical Foundations of Machine Learning
机器学习的数学基础
- DOI:
10.4171/owr/2021/15 - 发表时间:
2022-03-14 - 期刊:
- 影响因子:0
- 作者:
Peter Bartlett;Cristina Butucea;Johannes Schmidt - 通讯作者:
Johannes Schmidt
Defending Against Saddle Point Attack in Byzantine-Robust Distributed Learning Supplementary Material
防御拜占庭稳健分布式学习补充材料中的鞍点攻击
- DOI:
10.1111/head.12872 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Dong Yin;Yudong Chen;K. Ramchandran;Peter Bartlett - 通讯作者:
Peter Bartlett
Can a Transformer Represent a Kalman Filter?
变压器可以代表卡尔曼滤波器吗?
- DOI:
10.48550/arxiv.2312.06937 - 发表时间:
2023-12-12 - 期刊:
- 影响因子:0
- 作者:
Gautam Goel;Peter Bartlett - 通讯作者:
Peter Bartlett
Space, the final frontier: outdoor access for people living with dementia
空间,最后的前沿:痴呆症患者的户外活动
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:3.4
- 作者:
Elaine Argyle;T. Dening;Peter Bartlett - 通讯作者:
Peter Bartlett
Minimax Fixed-Design Linear Regression
极小极大固定设计线性回归
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Peter Bartlett; Wouter Koolen; Alan Malek; Eiji Takimoto; Manfred Warmuth - 通讯作者:
Manfred Warmuth
Peter Bartlett的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Peter Bartlett', 18)}}的其他基金
Collaboration on the Theoretical Foundations of Deep Learning
深度学习理论基础的合作
- 批准号:
2031883 - 财政年份:2020
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
RI: AF: Small: Optimizing probabilities for learning: sampling meets optimization
RI:AF:小:优化学习概率:采样满足优化
- 批准号:
1909365 - 财政年份:2019
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
RI: AF: Small: Deep Learning Theory
RI:AF:小:深度学习理论
- 批准号:
1619362 - 财政年份:2016
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
Regularization Methods for Online Learning
在线学习的正则化方法
- 批准号:
0830410 - 财政年份:2008
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
Statistical Methods for Prediction of Individual Sequences
预测个体序列的统计方法
- 批准号:
0707060 - 财政年份:2007
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
MSPA-MCS: Collaborative Research: Statistical Learning Methods for Complex Decision Problems in Natural Language Processing
MSPA-MCS:协作研究:自然语言处理中复杂决策问题的统计学习方法
- 批准号:
0434383 - 财政年份:2004
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
相似国自然基金
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
- 批准号:82370157
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
- 批准号:82303789
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
间充质干细胞微粒通过U2AF1负调控pDC活化改善系统性红斑狼疮的机制研究
- 批准号:82302029
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
- 批准号:82300739
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
- 批准号:32372727
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
AF:Small: Bayesian Estimation and Constraint Satisfaction
AF:Small:贝叶斯估计和约束满足
- 批准号:
2342192 - 财政年份:2024
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Structural Graph Algorithms via General Frameworks
合作研究:AF:小型:通过通用框架的结构图算法
- 批准号:
2347321 - 财政年份:2024
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
AF: Small: Communication-Aware Algorithms for Dynamic Allocation of Heterogeneous Resources
AF:小型:用于异构资源动态分配的通信感知算法
- 批准号:
2335187 - 财政年份:2024
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Exploring the Frontiers of Adversarial Robustness
合作研究:AF:小型:探索对抗鲁棒性的前沿
- 批准号:
2335412 - 财政年份:2024
- 资助金额:
$ 35万 - 项目类别:
Standard Grant