RI: Small: Modeling Multiple Modalities for Knowledge-Base Construction

RI:小型:知识库构建的多种模式建模

基本信息

  • 批准号:
    1817183
  • 负责人:
  • 金额:
    $ 44.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-01 至 2022-07-31
  • 项目状态:
    已结题

项目摘要

Information-rich documents are prevalent in many domains such as news articles, social media posts, online retail pages, healthcare records, financial reports, and scientific papers. Automatically extracting knowledge from such documents is useful in many applications, such as for answering questions, searching the web, automated dialogs, and analyzing trends. Existing machine learning methods focus only on the text in the documents, and ignore other information sources such as images, tables, and numbers. Thus, much of the information is not extracted, leading to incomplete knowledge and incorrect conclusions. This research advances research in machine learning and natural language processing to address these problems. With support for accurate extraction and reasoning, this project will pave the way for novel applications to domains with unstructured, multimodal documents.The specific aim of the project is to investigate a novel construction pipeline for knowledge bases, taking the first steps in combining textual and relational evidence with numerical, image, and tabular data. To address the many interconnected challenges therein, the project focuses on two sub-tasks. First, the team will extract new facts about an entity from a document, such as its attributes, by combining the different parts (text, images, and tables). Second, the team will develop models to identify missing relations in graphs that contain multimodal facts. For each task, the project includes plans to introduce new datasets, propose benchmark evaluations, and develop appropriate baselines. Further, the team will build upon recent advances in deep neural encoders to investigate machine learning approaches that learn unified, semantic embeddings to model multimodal data. With these contributions, the project will initiate a body of research in machine learning and natural language processing that uses unstructured multimodal data in all its forms for accurate knowledge extraction.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
信息丰富的文档在许多领域中都普遍存在,例如新闻文章,社交媒体帖子,在线零售页面,医疗保健记录,财务报告和科学论文。从此类文档中自动提取知识在许多应用程序中很有用,例如回答问题,搜索网络,自动对话框和分析趋势。现有的机器学习方法仅关注文档中的文本,而忽略其他信息源,例如图像,表格和数字。因此,许多信息未提取,导致知识不完整和结论不正确。这项研究推进了机器学习和自然语言处理的研究,以解决这些问题。为了支持准确的提取和推理,该项目将为具有非结构化的多模式文档的域名铺平道路。该项目的具体目的是研究知识基础的新型构建管道,采取了将文本和关系证据与数字,图像和图像和表格数据相结合的第一步。为了应对其中的许多相互联系的挑战,该项目着重于两个子任务。首先,团队将通过组合不同的部分(文本,图像和表格)来从文档(例如其属性)中提取有关实体的新事实。其次,团队将开发模型,以识别包含多模式事实的图表中的缺失关系。对于每个任务,该项目包括介绍新数据集,提出基准评估并开发适当基准的计划。此外,该团队将基于深度神经编码者的最新进展,以研究学习统一的语义嵌入以建模多模式数据的机器学习方法。有了这些贡献,该项目将启动机器学习和自然语言处理方面的研究,该研究使用其所有形式的非结构化多模式数据进行准确的知识提取。该奖项反映了NSF的法定任务,并被认为是通过基金会的知识分子优点和更广泛的影响审查标准来通过评估来获得支持的。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tweeki: Linking Named Entities on Twitter to a Knowledge Graph
  • DOI:
    10.18653/v1/2020.wnut-1.29
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bahareh Harandizadeh;Sameer Singh
  • 通讯作者:
    Bahareh Harandizadeh;Sameer Singh
Knowledge Enhanced Contextual Word Representations
  • DOI:
    10.18653/v1/d19-1005
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Matthew E. Peters;Mark Neumann;IV RobertL.Logan;Roy Schwartz;Vidur Joshi;Sameer Singh;Noah A. Smith-
  • 通讯作者:
    Matthew E. Peters;Mark Neumann;IV RobertL.Logan;Roy Schwartz;Vidur Joshi;Sameer Singh;Noah A. Smith-
Enforcing Consistency in Weakly Supervised Semantic Parsing
增强弱监督语义解析的一致性
Embedding Multimodal Relational Data for Knowledge Base Completion
  • DOI:
    10.18653/v1/d18-1359
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pouya Pezeshkpour;Liyan Chen;Sameer Singh
  • 通讯作者:
    Pouya Pezeshkpour;Liyan Chen;Sameer Singh
Barack’s Wife Hillary: Using Knowledge Graphs for Fact-Aware Language Modeling
  • DOI:
    10.18653/v1/p19-1598
  • 发表时间:
    2019-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    IV RobertL.Logan;Nelson F. Liu;Matthew E. Peters;Matt Gardner;Sameer Singh
  • 通讯作者:
    IV RobertL.Logan;Nelson F. Liu;Matthew E. Peters;Matt Gardner;Sameer Singh
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sameer Singh其他文献

Modeling Performance of Different Classification Methods : Deviation from the Power Law
不同分类方法的建模性能:偏离幂律
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sameer Singh
  • 通讯作者:
    Sameer Singh
Multi-stage Classification for Audio Based Activity Recognition
基于音频的活动识别的多级分类
  • DOI:
    10.1007/11875581_100
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    José Lopes;Charles Lin;Sameer Singh
  • 通讯作者:
    Sameer Singh
ezCoref : A Scalable Approach for Collecting Crowdsourced Annotations for Coreference Resolution
ezCoref:一种收集众包注释以进行共指解析的可扩展方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Crowdsourced;David Bamman;Olivia Lewke;Rachel Bawden;Rico Sennrich;Alexandra Birch;Ari Bornstein;Arie Cattan;Ido Dagan;Hong Chen;Zhenhua Fan;Hao Lu;Alan Yuille;Eduard Hovy;Mitch Marcus;M. Palmer;Lance;Rodney Huddleston. 2002;Frédéric Landragin;T. Poibeau;Bernard Vic;Belinda Z. Li;Gabriel Stanovsky;Robert L Logan;Andrew McCallum;Sameer Singh
  • 通讯作者:
    Sameer Singh
Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills
技能集优化:通过可转移技能强化语言模型行为
  • DOI:
    10.48550/arxiv.2402.03244
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kolby Nottingham;Bodhisattwa Prasad Majumder;Bhavana Dalvi;Sameer Singh;Peter Clark;Roy Fox
  • 通讯作者:
    Roy Fox
A survey of object recognition methods for automatic asset detection in high-definition video
高清视频中自动资产检测的对象识别方法综述

Sameer Singh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sameer Singh', 18)}}的其他基金

CAREER: Detecting, Understanding, and Fixing Vulnerabilities in Natural Language Processing Models
职业:检测、理解和修复自然语言处理模型中的漏洞
  • 批准号:
    2046873
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Post hoc Explanations in the Wild: Exposing Vulnerabilities and Ensuring Robustness
合作研究:RI:小型:事后解释:暴露漏洞并确保稳健性
  • 批准号:
    2008956
  • 财政年份:
    2020
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
CCRI: ENS: Machine Learning Democratization via a Linked, Annotated Repository of Datasets
CCRI:ENS:通过链接、带注释的数据集存储库实现机器学习民主化
  • 批准号:
    1925741
  • 财政年份:
    2019
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
CRII: RI: Explaining Decisions of Black-box Models via Input Perturbations
CRII:RI:通过输入扰动解释黑盒模型的决策
  • 批准号:
    1756023
  • 财政年份:
    2018
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant

相似国自然基金

靶向Treg-FOXP3小分子抑制剂的筛选及其在肺癌免疫治疗中的作用和机制研究
  • 批准号:
    32370966
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
化学小分子激活YAP诱导染色质可塑性促进心脏祖细胞重编程的表观遗传机制研究
  • 批准号:
    82304478
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
靶向小胶质细胞的仿生甘草酸纳米颗粒构建及作用机制研究:脓毒症相关性脑病的治疗新策略
  • 批准号:
    82302422
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
HMGB1/TLR4/Cathepsin B途径介导的小胶质细胞焦亡在新生大鼠缺氧缺血脑病中的作用与机制
  • 批准号:
    82371712
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

RI:Small: Modeling and Relating Visual Tasks
RI:Small:建模和关联视觉任务
  • 批准号:
    2329927
  • 财政年份:
    2023
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2007994
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2007955
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2008011
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
RI: Small: Modeling Co-Decisions: A Computational Framework Using Language and Metadata
RI:小型:共同决策建模:使用语言和元数据的计算框架
  • 批准号:
    2008761
  • 财政年份:
    2020
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了