CAREER: Building Next-Generation Language Models Based on Retrieval

职业:基于检索构建下一代语言模型

基本信息

  • 批准号:
    2239290
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-02-15 至 2028-01-31
  • 项目状态:
    未结题

项目摘要

Large language models (LMs) have revolutionized the field of natural language processing, achieving state-of-the-art performance in a wide range of downstream tasks. Despite the success, these LMs are trained on enormous amounts of text data and cost a massive amount to create and run. Additionally, they are inherently difficult to interpret, challenging to update with ever-changing real-world information, and may leak private user information. This proposal seeks to develop an alternative paradigm to standard language modeling: retrieval-based language models, with the aim of reducing training and inference costs while also providing benefits such as better interpretability, adaptability, and privacy. This research will be integrated into education through new teaching modules in developing undergraduate and graduate natural language processing courses, promoting education for undergraduate research, and outreach to K-12 students and teachers from underrepresented communities.This project addresses a full pipeline including training, scaling, adapting, and using retrieval-based language models and is organized into four components, including (1) building a general learning framework for retrieval-based LMs and developing scalable algorithms to support end-to-end learning; (2) investigating the scaling law of retrieval-based LMs and developing better data quantization to improve inference efficiency; (3) devising methods to quickly update retrieval-based LMs and adapt them to unseen and privacy-sensitive domains; (4) designing effective approaches to use retrieval-based LMs on downstream tasks.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
大型语言模型 (LM) 彻底改变了自然语言处理领域,在各种下游任务中实现了最先进的性能。尽管取得了成功,但这些语言模型需要接受大量文本数据的训练,并且创建和运行成本高昂。此外,它们本质上难以解释,难以根据不断变化的现实世界信息进行更新,并且可能会泄露私人用户信息。该提案旨在开发标准语言建模的替代范式:基于检索的语言模型,目的是减少训练和推理成本,同时提供更好的可解释性、适应性和隐私性等好处。这项研究将通过新的教学模块融入教育,开发本科生和研究生自然语言处理课程,促进本科生研究教育,以及向来自代表性不足社区的 K-12 学生和教师进行推广。该项目涉及包括培训、扩展在内的完整管道。 、适应和使用基于检索的语言模型,分为四个部分,包括(1)为基于检索的语言模型构建通用学习框架,并开发可扩展的算法以支持端到端学习; (2)研究基于检索的语言模型的缩放规律并开发更好的数据量化以提高推理效率; (3)设计快速更新基于检索的语言模型并使其适应不可见和隐私敏感领域的方法; (4) 设计有效的方法,在下游任务中使用基于检索的 LM。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop Questions
MQuAKE:通过多跳问题评估语言模型中的知识编辑
Retrieval-based Language Models and Applications
基于检索的语言模型和应用
  • DOI:
    10.18653/v1/2023.acl-tutorials.6
  • 发表时间:
    2024-09-13
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Akari Asai;Sewon Min;Zexuan Zhong;Danqi Chen
  • 通讯作者:
    Danqi Chen
Privacy Implications of Retrieval-Based Language Models
基于检索的语言模型的隐私影响
  • DOI:
    10.48550/arxiv.2305.14888
  • 发表时间:
    2023-05-24
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yangsibo Huang;Samyak Gupta;Zexuan Zhong;K. Li;Danqi Chen
  • 通讯作者:
    Danqi Chen
Enabling Large Language Models to Generate Text with Citations
启用大型语言模型来生成带引文的文本
Adapting Language Models to Compress Contexts
调整语言模型以压缩上下文
  • DOI:
    10.48550/arxiv.2305.14788
  • 发表时间:
    2023-05-24
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alexis Chevalier;Ale;er Wettig;er;Anirudh Ajith;Danqi Chen
  • 通讯作者:
    Danqi Chen
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Danqi Chen其他文献

Study on the stability and rheological properties of nitrogen foam under high-pressure condition
高压条件下氮气泡沫稳定性及流变性能研究
Improving Unsupervised Sentence Simplification Using Fine-Tuned Masked Language Models
使用微调的屏蔽语言模型改进无监督句子简化
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fernando Alva;Louis Martin;Carolina Scarton;Dhruv Kumar;Lili Mou;Lukasz Golab;Yinhan Liu;Myle Ott;Naman Goyal;Jingfei Du;Mandar Joshi;Danqi Chen;Omer Levy;Mike Lewis;Xiaofei Ma;Peng Xu;Zhiguo Wang;Ramesh Nallapati;Angela Fan;E. de;La Clergerie;Tomáš Mikolov;I. Sutskever;Kai Chen;Greg S Cor
  • 通讯作者:
    Greg S Cor
Causal Transformers: Improving the Robustness on Spurious Correlations
因果变换器:提高虚假相关性的鲁棒性
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Krueger;Ethan Caballero;Joern;Amy Zhang;Jonathan Binas;Dinghuai Zhang;Yinhan Liu;Myle Ott;Naman Goyal;Jingfei Du;M;ar Joshi;ar;Danqi Chen;Omer Levy;Mike Lewis;Ze Liu;Yutong Lin;Yue Cao;Han Hu;Yixuan Wei;Jiasen Lu;Dhruv Batra;Devi Parikh;Tom McCoy;Ellie Pavlick;Tal Linzen;Nikita Nangia;Adina Williams;A. Lazaridou;Ankur P. Parikh;Oscar Täckström;Dipanjan Das;Jeffrey Pennington;R. Socher;Lihua Qian;Hao Zhou;Yu Bao;Mingxuan Wang;Lin;Alec Radford;Jeffrey Wu;R. Child;D. Luan;Chitwan Saharia;William Chan;Saurabh Saxena;Rico Sennrich;B. Haddow;Ale;ra Birch;ra
  • 通讯作者:
    ra
Open-Domain Question Answering
开放域问答
Analyzing CodeBERT’s Performance on Natural Language Code Search
分析 CodeBERT 在自然语言代码搜索方面的性能
  • DOI:
    10.1016/j.jss.2023.111948
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daya Guo;Shuo Ren;Shuai Lu;Zhangyin Feng;Duyu;Shujie Tang;Long Liu;Nan Zhou;Alexey Duan;Svy;Michele Fu;Shao Tufano;Kun;Colin B Deng;Dawn Clement;Neel Drain;Sundare;Emily Hill;Lori Pollock;Hamel Husain;Hongduo Wu;Tiferet Gazit;Miltiadis;Allamanis Marc;Brockschmidt. 2019;Code;Yinhan Liu;Myle Ott;Naman Goyal;Jingfei Du;M;ar Joshi;ar;Danqi Chen;Omer Levy;Mike Lewis;Alexey Junjie Huang;A. Svyatkovskiy;Colin B Blanco;Clément;dong Zhou;Linjun Shou;Long Zhou;Michele Tu;Ming Gong;Ming Zhou;Nan Duan;Shao Kun Deng;Sheng;Thomas Wolf;Lys;re Debut;re;Julien Victor Sanh;Clement Chaumond;Anthony Delangue;Pier;Tim ric Cistac;Rémi Rault;Morgan Louf;Funtow;Sam Davison;Patrick Shleifer;V. Platen;Clara Ma;Yacine Jernite;J. Plu;Canwen Xu;Teven Le Scao;Sylvain Gugger;Mariama Drame;Yonghui Wu;Mike Schuster;Zhifeng Chen;Quoc V. Le;Mohammad Norouzi;Wolfgang Macherey;Maxim;Yuan Krikun;Qin Cao;Klaus Gao;J. Macherey;Apurva Klingner;M. Shah;Xiaobing Johnson;ukasz Liu;Stephan Kaiser;Yoshikiyo Gouws;Kato;Ziyu Yao;Jayavardhan Reddy Peddamail;Pengcheng Yin;Bowen Deng;Edgar Chen;Jian Zhang;Xu Wang;Hongyu Zhang;Hailong Sun
  • 通讯作者:
    Hailong Sun

Danqi Chen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Danqi Chen', 18)}}的其他基金

WORKSHOP: Doctoral consortium at Student Research Workshop at the North American Chapter of the Association for Computational Linguistics
研讨会:计算语言学协会北美分会学生研究研讨会上的博士联盟
  • 批准号:
    2225202
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant

相似国自然基金

基于传统桥梁营造智慧的现代木结构模块化集成建筑(T-MiC)设计体系
  • 批准号:
    52378023
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于智能合约的装配式建筑跨域流程协同与优化研究
  • 批准号:
    72301068
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
光伏直驱空调系统控制与建筑被动储能协同优化机制的研究
  • 批准号:
    52308091
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于计算机视觉的北京老旧居住建筑立面品质测评与生成式更新设计研究
  • 批准号:
    52378022
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
建筑微纳材料复合外窗光热作用机制与效应研究
  • 批准号:
    52378096
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目

相似海外基金

TRIO Networking Core
TRIO 网络核心
  • 批准号:
    10725473
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
Improving awareness of women with hypertension: ROAR (Rural, Obese, At Risk) - Leadership Administrative Core (LAC)
提高女性高血压患者的意识:ROAR(农村、肥胖、危险)- 领导行政核心 (LAC)
  • 批准号:
    10714534
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
Mentoring the next generation of substance use, HIV, and epigenetic researchers in sexual and gender minority health
指导下一代性和性别少数健康领域的药物滥用、艾滋病毒和表观遗传学研究人员
  • 批准号:
    10699933
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
The CORAL Training Core
CORAL 培训核心
  • 批准号:
    10755461
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
2023 Phagocytes Gordon Research Conference and Gordon Research Seminar
2023吞噬细胞戈登研究大会暨戈登研究研讨会
  • 批准号:
    10683594
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了