III: Small: Collaborative Learning with Incomplete and Noisy Knowledge

III:小:知识不完整且有噪音的协作学习

基本信息

  • 批准号:
    1904183
  • 负责人:
  • 金额:
    $ 35.09万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-07-01 至 2021-07-31
  • 项目状态:
    已结题

项目摘要

The accelerated growth of Big Data has created enormous amount of information at the macro level for knowledge discovery. But at the micro level, one can only expect a handful of observations in most individual users. This hinders the exploration of subtle patterns and heterogeneities among distinct users for improving the utility of Big Data analytics at a per-user basis. The objective of this project is to develop a set of algorithmic solutions to perform online learning in a collaborative fashion, where personalized learning solutions actively interact with users for feedback acquisition and collaborate with each other to learn from incomplete and noisy input. This project amplifies the utility of statistical learning in many important fields, such as healthcare, business intelligence, crowdsourcing, and cyber physical systems, where automated decision models are built on diverse, noisy and heterogeneous supervision. The research activities will be incorporated into teaching materials for student training and education in the areas of information retrieval, machine learning and data mining. This project consists of three synergistic research thrusts. First, it develops a family of contextual bandit algorithms to perform collaborative online learning over networked users. Dependency among users is estimated and exploited to collaboratively update the individualized bandit parameters. Second, it develops principled solutions to optimize task-specific and general loss functions for online learning, which enables the collaborative learning solutions reach more important real-world applications, such as information retrieval and user behavior modeling. Third, it models and differentiates the reliability of the sources of feedback to optimize the overall online learning effectiveness, which is especially important in the applications such as health informatics, crowdsourcing and cyber physical systems. Expected outcomes of the project include: 1) open source implementations for the developed online learning solutions; and 2) evaluation corpora that will enable researchers to conduct follow-up research in related domains.
大数据的加速增长为知识发现创造了宏观层面的海量信息。但在微观层面上,我们只能期望在大多数个人用户中得到少量的观察结果。这阻碍了对不同用户之间微妙模式和异质性的探索,以提高每个用户的大数据分析的实用性。该项目的目标是开发一套算法解决方案,以协作方式执行在线学习,其中个性化学习解决方案积极与用户交互以获取反馈,并相互协作从不完整和嘈杂的输入中学习。 该项目扩大了统计学习在许多重要领域的效用,例如医疗保健、商业智能、众包和网络物理系统,其中自动化决策模型建立在多样化、嘈杂和异构的监督之上。研究活动将被纳入信息检索、机器学习和数据挖掘领域学生培训和教育的教材中。该项目由三个协同研究重点组成。首先,它开发了一系列上下文强盗算法,以通过网络用户执行协作在线学习。估计并利用用户之间的依赖性来协作更新个性化老虎机参数。其次,它开发了原则性的解决方案来优化在线学习的特定任务和一般损失函数,这使得协作学习解决方案能够达到更重要的现实应用,例如信息检索和用户行为建模。第三,它对反馈源的可靠性进行建模和区分,以优化整体在线学习效果,这在健康信息学、众包和网络物理系统等应用中尤其重要。该项目的预期成果包括:1)开发的在线学习解决方案的开源实现; 2)评估语料库,使研究人员能够在相关领域进行后续研究。

项目成果

期刊论文数量(19)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Nearly Minimax Optimal Regret for Learning Infinite-horizon Average-reward MDPs with Linear Function Approximation
使用线性函数逼近学习无限视野平均奖励 MDP 的近极小极大最优遗憾
  • DOI:
  • 发表时间:
    2021-02-15
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yue Wu;Dongruo Zhou;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Logarithmic Regret for Reinforcement Learning with Linear Function Approximation
线性函数逼近强化学习的对数遗憾
  • DOI:
    10.48550/arxiv.2306.07745
  • 发表时间:
    2020-11-23
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiafan He;Dongruo Zhou;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Nearly Minimax Optimal Reinforcement Learning for Discounted MDPs
贴现 MDP 的近极小极大最优强化学习
Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs
用于学习对抗性线性混合 MDP 的近最优策略优化算法
Learning Neural Contextual Bandits through Perturbed Rewards
通过扰动奖励学习神经情境强盗
  • DOI:
  • 发表时间:
    2022-01-24
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yiling Jia;Weitong Zhang;Dongruo Zhou;Quanquan Gu;Hongning Wang
  • 通讯作者:
    Hongning Wang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Quanquan Gu其他文献

Mean-Field Analysis of Two-Layer Neural Networks: Non-Asymptotic Rates and Generalization Bounds
两层神经网络的平均场分析:非渐近率和泛化界限
  • DOI:
  • 发表时间:
    2020-02-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zixiang Chen;Yuan Cao;Quanquan Gu;Tong Zhang
  • 通讯作者:
    Tong Zhang
Optimal Online Generalized Linear Regression with Stochastic Noise and Its Application to Heteroscedastic Bandits
随机噪声下的最优在线广义线性回归及其在异方差强盗中的应用
  • DOI:
  • 发表时间:
    2022-02-28
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Heyang Zhao;Dongruo Zhou;Jiafan He;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Pure Exploration in Asynchronous Federated Bandits
异步联邦强盗的纯粹探索
  • DOI:
    10.48550/arxiv.2310.11015
  • 发表时间:
    2023-10-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zichen Wang;Chuanhao Li;Chenyu Song;Lianghui Wang;Quanquan Gu;Huazheng Wang
  • 通讯作者:
    Huazheng Wang
Differentially Private Hypothesis Transfer Learning
差分私有假设迁移学习
  • DOI:
    10.1007/978-3-030-10928-8_48
  • 发表时间:
    2018-09-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yang Wang;Quanquan Gu;Donald E. Brown
  • 通讯作者:
    Donald E. Brown
Fast and Sample Efficient Inductive Matrix Completion via Multi-Phase Procrustes Flow
通过多相 Procrustes 流快速高效地完成归纳矩阵
  • DOI:
  • 发表时间:
    2018-03-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiao Zhang;S. Du;Quanquan Gu
  • 通讯作者:
    Quanquan Gu

Quanquan Gu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Quanquan Gu', 18)}}的其他基金

CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
  • 批准号:
    2312094
  • 财政年份:
    2023
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
Collaborative Research: Towards the Foundation of Approximate Sampling-Based Exploration in Sequential Decision Making
协作研究:为顺序决策中基于近似采样的探索奠定基础
  • 批准号:
    2323113
  • 财政年份:
    2023
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms
III:小:迈向训练深度神经网络的基础:新理论和算法
  • 批准号:
    2008981
  • 财政年份:
    2020
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research: Rank Aggregation with Heterogeneous Information Sources: Efficient Algorithms and Fundamental Limits
CIF:小型:协作研究:异构信息源的排名聚合:高效算法和基本限制
  • 批准号:
    1911168
  • 财政年份:
    2019
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Taming Big Networks via Embedding
BIGDATA:F:协作研究:通过嵌入驯服大网络
  • 批准号:
    1741342
  • 财政年份:
    2018
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Taming Big Networks via Embedding
BIGDATA:F:协作研究:通过嵌入驯服大网络
  • 批准号:
    1855099
  • 财政年份:
    2018
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
CAREER: Scaling Up Knowledge Discovery in High-Dimensional Data Via Nonconvex Statistical Optimization
职业:通过非凸统计优化扩大高维数据中的知识发现
  • 批准号:
    1906169
  • 财政年份:
    2018
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: High-Dimensional Machine Learning Methods for Personalized Cancer Genomics
III:小:协作研究:个性化癌症基因组学的高维机器学习方法
  • 批准号:
    1903202
  • 财政年份:
    2018
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Continuing Grant
CAREER: Scaling Up Knowledge Discovery in High-Dimensional Data Via Nonconvex Statistical Optimization
职业:通过非凸统计优化扩大高维数据中的知识发现
  • 批准号:
    1652539
  • 财政年份:
    2017
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: High-Dimensional Machine Learning Methods for Personalized Cancer Genomics
III:小:协作研究:个性化癌症基因组学的高维机器学习方法
  • 批准号:
    1717206
  • 财政年份:
    2017
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Continuing Grant

相似国自然基金

ALKBH5介导的SOCS3-m6A去甲基化修饰在颅脑损伤后小胶质细胞炎性激活中的调控作用及机制研究
  • 批准号:
    82301557
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miRNA前体小肽miPEP在葡萄低温胁迫抗性中的功能研究
  • 批准号:
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
PKM2苏木化修饰调节非小细胞肺癌起始细胞介导的耐药生态位的机制研究
  • 批准号:
    82372852
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于翻译组学理论探究LncRNA H19编码多肽PELRM促进小胶质细胞活化介导电针巨刺改善膝关节术后疼痛的机制研究
  • 批准号:
    82305399
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CLDN6高表达肿瘤细胞亚群在非小细胞肺癌ICB治疗抗性形成中的作用及机制研究
  • 批准号:
    82373364
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 35.09万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了