Collaborative Research: AF: Medium: Algorithmic High-Dimensional Robust Statistics

合作研究:AF:中:算法高维稳健统计

基本信息

  • 批准号:
    2107079
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-07-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

The broad task of making accurate inferences from high-dimensional and contaminated datasets is of fundamental importance and has become a key challenge in a number of pressing data-analysis applications. These include (1) data-poisoning attacks in machine learning (ML), where even a small fraction of adversarial data inserted by malicious users can substantially degrade the quality of the ML system, and (2) exploratory analysis of scientific datasets (e.g., in biology), where systematic errors can create structured corruptions that require painstaking effort to detect. To address these challenges, there is a real need to develop efficient robust learning algorithms -- methods whose performance is stable to deviations from the idealized assumptions about the input data. The precise form of these deviations is problem-specific and gives rise to various notions of robustness. The overarching goal of this project is to develop a general algorithmic theory of high-dimensional robust statistics and learning. A crucial component of the project involves building bridges between different communities, by organizing interdisciplinary workshops, and writing a new graduate textbook on the topic. Moreover, the investigators are mentoring undergraduate students and design new data-centric courses integrating research and teaching.The technical core of this project consists of two interrelated thrusts: (1) List-Decodable Learning and Mixture Models: The majority of recent literature in algorithmic high-dimensional robust learning focuses on the setting where the clean data is the majority of the dataset. List-decodable learning is a relaxed notion of learning capturing the regime where the clean data is a minority of the input dataset, and can be used to model important data-science applications, such as crowdsourcing with a majority of unreliable respondents and learning-mixture models. The project is developing a unified theory with the goal of uncovering which distributional parameters can be efficiently list-decoded, and leveraging this theory to understand the complexity of learning mixture models. (2) Robust Supervised Learning of Geometric Concepts: The goal of supervised learning is to infer a function from a collection of labeled observations. Supervised learning has traditionally been concerned with the problem of generalizing from a set of correctly labeled examples. In many realistic scenarios, a fraction of the points and/or labels may be corrupted by noise, e.g., due to sensor errors or adversarial data poisoning. Hence, it is important to develop efficient algorithms that produce accurate predictors under these conditions. The project is developing efficient robust learning algorithms for rich families of geometric concepts with respect to natural and well-studied semi-random noise models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
从高维和受污染的数据集中进行准确推断的广泛任务至关重要,并且已成为许多紧迫的数据分析应用中的关键挑战。其中包括 (1) 机器学习 (ML) 中的数据中毒攻击,即使是恶意用户插入的一小部分对抗性数据也会大大降低 ML 系统的质量,以及 (2) 对科学数据集的探索性分析(例如,在生物学中),系统错误可能会造成结构性损坏,需要付出艰苦的努力才能发现。为了应对这些挑战,确实需要开发高效、鲁棒的学习算法,即其性能对于与输入数据的理想化假设的偏差保持稳定的方法。这些偏差的精确形式是针对特定问题的,并产生了各种鲁棒性概念。该项目的总体目标是开发高维鲁棒统计和学习的通用算法理论。该项目的一个重要组成部分包括通过组织跨学科研讨会和编写有关该主题的新研究生教科书,在不同社区之间建立桥梁。此外,研究人员正在指导本科生并设计新的以数据为中心的课程,将研究和教学结合起来。该项目的技术核心包括两个相互关联的主旨:(1)列表可解码学习和混合模型:算法领域的大多数最新文献高维鲁棒学习侧重于干净数据占数据集大部分的设置。列表可解码学习是一种宽松的学习概念,捕获干净数据占输入数据集的少数的状态,可用于对重要的数据科学应用进行建模,例如与大多数不可靠的受访者进行众包和学习混合模型。 该项目正在开发一种统一的理论,其目标是揭示哪些分布参数可以有效地进行列表解码,并利用该理论来理解学习混合模型的复杂性。 (2) 几何概念的鲁棒监督学习:监督学习的目标是从一组标记的观察结果中推断出一个函数。传统上,监督学习关注的是从一组正确标记的示例中进行概括的问题。在许多现实场景中,一小部分点和/或标签可能会被噪声破坏,例如由于传感器错误或对抗性数据中毒。因此,开发在这些条件下产生准确预测变量的有效算法非常重要。该项目正在针对自然和经过充分研究的半随机噪声模型,为丰富的几何概念家族开发高效、鲁棒的学习算法。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和更广泛的评估进行评估,被认为值得支持。影响审查标准。

项目成果

期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Forster Decomposition and Learning Halfspaces with Noise
  • DOI:
  • 发表时间:
    2021-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;D. Kane;Christos Tzamos
  • 通讯作者:
    Ilias Diakonikolas;D. Kane;Christos Tzamos
Cryptographic Hardness of Learning Halfspaces with Massart Noise
使用 Massart 噪声学习半空间的密码学硬度
Learning a Single Neuron with Adversarial Label Noise via Gradient Descent
  • DOI:
    10.48550/arxiv.2206.08918
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis
  • 通讯作者:
    Ilias Diakonikolas;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis
A Strongly Polynomial Algorithm for Approximate Forster Transforms and Its Application to Halfspace Learning
一种近似福斯特变换的强多项式算法及其在半空间学习中的应用
Optimal SQ Lower Bounds for Robustly Learning Discrete Product Distributions and Ising Models
  • DOI:
    10.48550/arxiv.2206.04589
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;D. Kane;Yuxin Sun
  • 通讯作者:
    Ilias Diakonikolas;D. Kane;Yuxin Sun
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ilias Diakonikolas其他文献

A Regularity Lemma, and Low-Weight Approximators, for Low-Degree Polynomial Threshold Functions
低次多项式阈值函数的正则引理和低权重近似器
Super Non-singular Decompositions of Polynomials and Their Application to Robustly Learning Low-Degree PTFs
多项式的超非奇异分解及其在鲁棒学习低次 PTF 中的应用
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;Daniel Kane;Vasilis Kontonis;Sihan Liu;Nikos Zarifis
  • 通讯作者:
    Nikos Zarifis
Online Learning of Halfspaces with Massart Noise
使用 Massart 噪声在线学习半空间
  • DOI:
    10.48550/arxiv.2405.12958
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis
  • 通讯作者:
    Nikos Zarifis
Threshold Phenomena in Learning Halfspaces with Massart Noise
使用 Massart 噪声学习半空间的阈值现象
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ilias Diakonikolas;D. Kane;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis
  • 通讯作者:
    Nikos Zarifis
Near-Optimal Closeness Testing of Discrete Histogram Distributions
离散直方图分布的近最优紧密度测试

Ilias Diakonikolas的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ilias Diakonikolas', 18)}}的其他基金

CAREER: Learning Algorithms with Robustness and Efficiency Guarantees
职业:学习具有鲁棒性和效率保证的算法
  • 批准号:
    2144298
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
AitF: Collaborative Research: Fast, Accurate, and Practical: Adaptive Sublinear Algorithms for Scalable Visualization
AitF:协作研究:快速、准确和实用:用于可扩展可视化的自适应次线性算法
  • 批准号:
    2006206
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CAREER: Efficient Algorithms for Learning and Testing Structured Probabilistic Models
职业:学习和测试结构化概率模型的有效算法
  • 批准号:
    2011255
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
CAREER: Efficient Algorithms for Learning and Testing Structured Probabilistic Models
职业:学习和测试结构化概率模型的有效算法
  • 批准号:
    1652862
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
AitF: Collaborative Research: Fast, Accurate, and Practical: Adaptive Sublinear Algorithms for Scalable Visualization
AitF:协作研究:快速、准确和实用:用于可扩展可视化的自适应次线性算法
  • 批准号:
    1733796
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Sublinear Algorithms for Approximating Probability Distributions
用于近似概率分布的次线性算法
  • 批准号:
    EP/L021749/1
  • 财政年份:
    2014
  • 资助金额:
    $ 60万
  • 项目类别:
    Research Grant

相似国自然基金

剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
  • 批准号:
    82370157
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
  • 批准号:
    82300739
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
间充质干细胞微粒通过U2AF1负调控pDC活化改善系统性红斑狼疮的机制研究
  • 批准号:
    82302029
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
circPOLB-MYC-U2AF2正反馈环路上调FSCN1促进舌鳞状细胞癌进展的作用研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
tsRNA-14765结合U2AF2抑制巨噬细胞自噬调节铁死亡对动脉粥样硬化的影响及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402836
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402851
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
  • 批准号:
    2342244
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Exploring the Frontiers of Adversarial Robustness
合作研究:AF:小型:探索对抗鲁棒性的前沿
  • 批准号:
    2335411
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
  • 批准号:
    2420942
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了