Collaborative Research: RI: Medium: Multilingual Long-form QA with Retrieval-Augmented Language Models

合作研究:RI:Medium:采用检索增强语言模型的多语言长格式 QA

基本信息

  • 批准号:
    2312949
  • 负责人:
  • 金额:
    $ 55.42万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-08-01 至 2027-07-31
  • 项目状态:
    未结题

项目摘要

This project aims to enable automatic question answering systems to produce paragraph-level answers. Prior work on question answering has focused on simpler questions that can be answered with short phrases. Building systems to produce paragraph-level answers opens up exciting opportunities to answer complicated questions, and to offer more nuanced and comprehensive answers to simpler questions. This project will create comprehensive and reliable evaluation protocols for long form question answering (LFQA), pioneer multilingual studies to broaden information access to a wider population, and develop new algorithms that integrate web search with LFQA systems to provide verifiable long form answers paired with human-written evidence documents. This project focuses on three core dimensions of LFQA – datasets, evaluation, and modeling. Expanding the scope of prior English-centric LFQA, this research will investigate multilingual capabilities of large language models by constructing multilingual LFQA datasets and studying knowledge transfer across languages. In terms of modeling, it will propose a new framework that iteratively weaves together – in a transparent manner—knowledge retrieved from documents and memorized knowledge from a language model. Finally for evaluation, the project will engage domain experts who are familiar with the question topic to provide rationales for their evaluation of model generated answers. Such feedback will be used to derive a fine-grained annotation framework which localizes errors and unpack the weaknesses of generated answers. Together, the proposed work will bring significant progress to LFQA, an emerging topic for natural language processing and artificial intelligence research.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在使自动问答系统能够产生段落级别的答案。关于问答的先前工作集中在可以用简短短语回答的更简单问题上。建立制作段落级别答案的系统为回答全面问题提供了令人兴奋的机会,并为更简单的问题提供了更多细微和全面的答案。该项目将为长期问答答案(LFQA)创建全面可靠的评估协议,先驱多语言研究,以扩大信息访问更广泛的人群的信息,并开发新的算法,这些算法将Web搜索与LFQA系统集成在一起,以提供可验证的长形式答案,并与人提供的证据配对。该项目着重于LFQA - 数据集,评估和建模的三个核心维度。扩大以前以英语为中心的LFQA的范围,这项研究将通过构建多语言LFQA数据集并研究跨语言的知识转移来研究大语言模型的多语言能力。在建模方面,它将提出一个新的框架,以透明的方式迭代地编织在一起,从文档中检索到的知识和从语言模型中的记忆知识中检索出来。最后,为了进行评估,该项目将吸引熟悉问题主题的领域专家,以提供对模型生成的答案的评估的理由。此类反馈将用于得出一个细粒的注释框架,该框架本地化错误并解开了生成的答案的弱点。拟议的工作将共同为LFQA带来重大进展,LFQA是一个新兴的自然语言处理和人工智能研究的主题。该奖项反映了NSF的法定任务,并通过使用基金会的知识分子优点和更广泛的影响评估审查标准来评估,被认为是珍贵的支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mohit Iyyer其他文献

Casting Light on Invisible Cities: Computationally Engaging with Literary Criticism
照亮看不见的城市:计算与文学批评的结合
  • DOI:
    10.18653/v1/n19-1130
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shufan Wang;Mohit Iyyer
  • 通讯作者:
    Mohit Iyyer
One Thousand and One Pairs: A"novel"challenge for long-context language models
一千零一对:长上下文语言模型的“新颖”挑战
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Marzena Karpinska;Katherine Thai;Kyle Lo;Tanya Goyal;Mohit Iyyer
  • 通讯作者:
    Mohit Iyyer
PaRaDe: Passage Ranking using Demonstrations with Large Language Models
PaRaDe:使用大型语言模型的演示进行段落排名
  • DOI:
    10.48550/arxiv.2310.14408
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Andrew Drozdov;Honglei Zhuang;Zhuyun Dai;Zhen Qin;Razieh Rahimi;Xuanhui Wang;Dana Alon;Mohit Iyyer;Andrew McCallum;Donald Metzler;Kai Hui
  • 通讯作者:
    Kai Hui
KNN-LM Does Not Improve Open-ended Text Generation
KNN-LM 没有改进开放式文本生成
  • DOI:
    10.48550/arxiv.2305.14625
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shufan Wang;Yixiao Song;Andrew Drozdov;Aparna Garimella;Varun Manjunatha;Mohit Iyyer
  • 通讯作者:
    Mohit Iyyer
Suri: Multi-constraint Instruction Following for Long-form Text Generation
Suri:长文本生成的多约束指令遵循
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chau Minh Pham;Simeng Sun;Mohit Iyyer
  • 通讯作者:
    Mohit Iyyer

Mohit Iyyer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mohit Iyyer', 18)}}的其他基金

Collaborative Research: STEM Learning Embedded in a Machine-in-the-Loop Collaborative Story Writing Game
协作研究:嵌入机器在环协作故事写作游戏中的 STEM 学习
  • 批准号:
    2202506
  • 财政年份:
    2022
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Standard Grant
CAREER: Building Creative Writing Assistants for Machine-in-the-Loop Storytelling
职业:为机器在环讲故事构建创意写作助手
  • 批准号:
    2046248
  • 财政年份:
    2021
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Continuing Grant
RI: Medium: Tree-Structured Self-Supervised Modeling for Natural Language
RI:中:自然语言的树结构自监督建模
  • 批准号:
    1955567
  • 财政年份:
    2020
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Continuing Grant

相似国自然基金

跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
    32200568
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
    82204762
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312842
  • 财政年份:
    2023
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312840
  • 财政年份:
    2023
  • 资助金额:
    $ 55.42万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了