III: Small: Collaborative Research: Algorithms, systems, and theories for exploiting data dependencies in crowdsourcing

III:小型:协作研究:在众包中利用数据依赖性的算法、系统和理论

基本信息

  • 批准号:
    2007941
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Data are abundantly available to encode knowledge in many domains, such as biomedical research, online commerce, open government, education, and public health. Machine learning is a powerful tool to discover novel knowledge from data and to help individuals and organizations make informed decisions. However, machine learning needs to be bootstrapped by human-annotated knowledge, which can be expensive to obtain and also contain human errors. The team of researchers discovers and exploits the dependencies in the data, via novel methodologies to significantly reduce the cost and noises when providing critical knowledge for machine learning. The research outputs, including algorithms, systems, and theories, are sufficiently generic to benefit many domains where machine learning is applicable. By conducting the fundamental research, the team will train undergraduates and graduates for the STEM workforce in the nation.The researchers will collaborate to develop algorithms, systems, and theories for reducing costs and noises when annotating dependent data, termed as “structured annotations”, to provide supervision knowledge for machine learning. While the dependencies can make data annotations costly and error-prone, the researchers view the dependencies as a useful inductive bias for selective and accurate annotations. In particular, the research team proposes a human-in-the-loop system to aid the construction of proper probabilistic graphical models to encode the dependencies. The project team combines contextual and multi-armed bandits with scalable graph inference algorithms to reduce labeling costs. Based on the graphical bandits, the team addresses the budget allocation when querying labels of the same data point repetitively for robustness. With noisy human annotations, the team formulates optimization problems and algorithms to jointly infer the annotator competences and the ground truth labels of the data. From the theoretical perspective, the project will advance the active learning in crowdsourcing settings with more realistic noise distributions and will analyze the regrets in structured annotations. The project will result in datasets, algorithms, and a testbed system that benefit not only the core machine learning research community but also many domains that use machine learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据可全面地用于编码许多领域的知识,例如生物医学研究,在线商业,开放政府,教育和公共卫生。机器学习是从数据中发现新知识并帮助个人和组织做出明智决定的强大工具。但是,机器学习需要由人类宣传的知识引导,这可能是昂贵的,并且还包含人类错误。研究人员团队通过新颖的方法发现并探索数据中的依赖性,以在为机器学习提供关键知识时大大降低成本和噪音。包括算法,系统和理论在内的研究输出足以使机器学习适用的许多领域受益。通过进行基本研究,该团队将培训本国STEM劳动力的大学生和毕业生。研究人员将合作开发算法,系统和理论,以减少注释依赖的数据(称为“结构化注释”),以提供机器学习的监督知识。虽然依赖项可以使数据注释昂贵且容易出错,但研究人员将依赖项视为有用的归纳偏见,可用于选择性和准确的注释。特别是,研究小组提出了一个人类的循环系统,以帮助构建适当的概率图形模型来编码依赖关系。项目团队将上下文和多军匪徒与可扩展的图形推理算法相结合,以降低标签成本。基于图形匪徒,团队在重复询问相同数据点的标签以重复稳健性时解决了预算分配。通过嘈杂的人类注释,团队提出了优化问题和算法,以共同推断出数据的注释能力和地面真相标签。从理论的角度来看,该项目将在具有更现实的噪声分布的众包环境中提高积极的学习,并将分析结构化注释中的遗憾。该项目将导致数据集,算法和测试床系统,不仅使核心机器学习研究社区受益,而且使许多使用机器学习的领域受益。该奖项反映了NSF的法定任务,并被认为是通过基金会的知识分子优点和更广泛的影响审查标准通过评估而被视为珍贵的支持。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SagDRE: Sequence-Aware Graph-Based Document-Level Relation Extraction with Adaptive Margin Loss
Relation-Aware Network with Attention-Based Loss for Few-Shot Knowledge Graph Completion
  • DOI:
    10.1007/978-3-031-33380-4_8
  • 发表时间:
    2023-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qiao Qiao-Qiao;Yuepei Li;Kang Zhou;Qi Li
  • 通讯作者:
    Qiao Qiao-Qiao;Yuepei Li;Kang Zhou;Qi Li
CPTAM: Constituency Parse Tree Aggregation Method
CPTAM:选区解析树聚合方法
Open-Domain Aspect-Opinion Co-Mining with Double-Layer Span Extraction
Data Poisoning Attacks and Defenses to Crowdsourcing Systems
  • DOI:
    10.1145/3442381.3450066
  • 发表时间:
    2021-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Minghong Fang;Minghao Sun;Qi Li;N. Gong;Jinhua Tian;Jia Liu
  • 通讯作者:
    Minghong Fang;Minghao Sun;Qi Li;N. Gong;Jinhua Tian;Jia Liu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Qi Li其他文献

Competing orders in s-wave and p -wave superconductors
s 波和 p 波超导体的竞争订单
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qi Li
  • 通讯作者:
    Qi Li
Improving the representation of convective heat transfer in an urban canopy model
改进城市冠层模型中对流换热的表示
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qi Li;Jiachuan Yang;Zhi;E. Bou‐Zeid
  • 通讯作者:
    E. Bou‐Zeid
Delay Allograft Rejection in Lymphopenic Hosts by Downregulating the Homeostatic Proliferation of CD 8 + T Cells
通过下调 CD 8 T 细胞的稳态增殖来延迟淋巴细胞减少宿主的同种异体移植排斥
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Zecher;Qi Li;M. Oberbarnscheidt;A. Demetris;W. Shlomchik;D. Rothstein;Fadi G Lakkis
  • 通讯作者:
    Fadi G Lakkis
Try before You Buy: Privacy-preserving Data Evaluation on Cloud-based Machine Learning Data Marketplace
先试后买:基于云的机器学习数据市场上的隐私保护数据评估
Microstrip-to- Waveguide Transition with Bias Tee for Photodiode Packaging at W-Band
用于 W 波段光电二极管封装的带偏置 T 形件的微带到波导过渡

Qi Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Qi Li', 18)}}的其他基金

AccelNet-Design: A Global Network of Networks of Integrated Urban Services (GNNIUS) for Healthy and Smart Cities
AccelNet-Design:面向健康和智慧城市的全球综合城市服务网络 (GNNIUS)
  • 批准号:
    2301858
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CAREER: Achieving Quality Information Extraction from Scientific Documents with Heterogeneous Weak Supervisions
职业:通过异构弱监督实现科学文档中的质量信息提取
  • 批准号:
    2237831
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CAREER: Multi-Scalar Transport and Similarity in the Urban Boundary Layer
职业:城市边界层的多标量交通和相似性
  • 批准号:
    2143664
  • 财政年份:
    2022
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: Geoengineering of Urban Green Infrastructure to Improve Outdoor Livability
合作研究:城市绿色基础设施地球工程,提高户外宜居性
  • 批准号:
    2028842
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CAS-MNP--Precursors of Long-Distance Aerial Transport of Microplastics from Urban Environments
合作研究:CAS-MNP——城市环境中长距离空中运输微塑料的前体
  • 批准号:
    2028644
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Design and Characterization of Two-Dimensional Electron Gas with Strong Spin-Orbit Coupling Based on Transition Metal Oxides
基于过渡金属氧化物的强自旋轨道耦合二维电子气的设计与表征
  • 批准号:
    1905833
  • 财政年份:
    2019
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Multiferroic Tunnel Junction with Active Dual Layer Barrier
具有主动双层势垒的多铁性隧道结
  • 批准号:
    1411166
  • 财政年份:
    2014
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Interfacial Electromagnetic Coupling in Multiferroic Tunnel Junctions
多铁性隧道结中的界面电磁耦合
  • 批准号:
    1207474
  • 财政年份:
    2012
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
III: Small: An Automatic Framework for Processing Drosophila Embryonic Images
III:小型:处理果蝇胚胎图像的自动框架
  • 批准号:
    1016668
  • 财政年份:
    2010
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Study of Multiferroic Tunnel Junctions
多铁性隧道结的研究
  • 批准号:
    0907604
  • 财政年份:
    2009
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
  • 批准号:
    61661005
  • 批准年份:
    2016
  • 资助金额:
    30.0 万元
  • 项目类别:
    地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
  • 批准号:
    61301143
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
  • 批准号:
    81072465
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基于小世界网络的传感器网络研究
  • 批准号:
    60472059
  • 批准年份:
    2004
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了