CompCog: RI: Small: Human-like semantic grammar induction through knowledge distillation from pre-trained language models

CompCog:RI:Small:通过预训练语言模型的知识蒸馏进行类人语义语法归纳

基本信息

  • 批准号:
    2313140
  • 负责人:
  • 金额:
    $ 48.45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

Human languages are thought to allow for an unbounded set of possible meanings to be expressed using bounded sets of rules, called grammars. These grammars assign meanings to words and compose meanings of words and phrases into larger phrases and clauses. Humans can communicate extremely precise descriptions of goals and world behaviors—and linguists know much about the logical structure of language involved in this kind of precise communication—but one of the central open questions in linguistics is how humans acquire these mechanisms. Computational models of how these grammars are learned from recorded or transcribed utterances can provide evidence that this learning can be accomplished by children without substantial innate biological biases, and these models can also provide automated tools for analysis and documentation of endangered languages, including many Indigenous American languages. Existing statistical and neural grammar learning methods can induce grammars from sentences in text corpora that predict about half of the phrases and clauses annotated by linguists; howevert this level of performance is nowhere near the accuracy of human language learners, and attempts to support this learning using image and video data have not substantially improved induction accuracy. The proposed work will instead extract statistics about logical predicates from large commercially available neural language models as a surrogate for human world knowledge so as to improve the accuracy of grammar induction.The proposed work will develop the first broad-coverage semantic grammar induction model that integrates world knowledge into the acquisition process by distilling it from large pre-trained neural language models. The world knowledge implicit in the large language models will be distilled into a matrix of predicate co-occurrence statistics using argument-specific prompts. The resulting predicate co-occurrence statistics will make no distinction between, for example, active and passive sentences, topicalized and non-topicalized sentences, or declarative and subject-auxiliary inverted sentences. This model will be used to evaluate claims about the statistical learnability of grammar. The proposed work will also continue work on developing resources for evaluating these structural models. The model and corpora collected as part of this project will be freely distributed on both university and external websites.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人类语言被认为允许使用有限的规则集(称为语法)来表达无限的可能含义,这些语法为单词赋予含义,并将单词和短语的含义组合成更大的短语和从句。对目标和世界行为的精确描述——语言学家对这种精确交流所涉及的语言逻辑结构了解很多——但语言学的核心开放问题之一是人类如何获得这些语法的计算模型。从记录或转录的话语中学习的数据可以提供证据,证明这种学习可以由没有明显先天生物学偏见的儿童完成,并且这些模型还可以提供用于分析和记录濒危语言的自动化工具,包括许多现有的美国本土统计和神经语言。语法语言学习方法可以从文本语料库中的句子中归纳出语法,这些语法可以预测语言学家注释的大约一半的短语和从句,但是这种性能水平远不及人类语言学习者的准确性,并且尝试使用图像来支持这种学习;和视频数据并没有显着提高归纳准确性。拟议的工作将从大型商用神经语言模型中提取有关逻辑谓词的统计数据作为人类世界知识的替代品,以提高语法归纳的准确性。拟议的工作将开发第一个广泛覆盖的语义语法归纳模型,通过从大型预训练神经语言模型中提取世界知识,将其集成到获取过程中。大型语言模型中隐含的世界知识将使用谓词共现统计数据被提取到矩阵中。论证特定的生成的谓词共现统计不会区分主动句和被动句、主题句和非主题句、陈述句和主助倒装句。该模型将用于评估有关统计的主张。拟议的工作还将继续开发用于评估这些结构模型的资源,作为该项目的一部分收集的模型和语料库将在大学和外部网站上免费分发。该奖项反映了 NSF 的法定使命和目标。通过使用基金会的智力价值和更广泛的影响审查标准进行评估,该项目被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Schuler其他文献

Analyzing complex human sentence processing dynamics with CDRNNs
使用 CDRNN 分析复杂的人类句子处理动态
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cory Shain;William Schuler
  • 通讯作者:
    William Schuler
Contributions of Propositional Content and Syntactic Category Information in Sentence Processing
命题内容和句法类别信息在句子处理中的贡献
Multi-Component TAG and Notions of Formal Power
多成分标签和形式权力的概念
Toward a Psycholinguistically-Motivated Model of Language Processing
走向心理语言学驱动的语言处理模型
  • DOI:
    10.3115/1599081.1599180
  • 发表时间:
    2008-08-18
  • 期刊:
  • 影响因子:
    3.8
  • 作者:
    William Schuler;S. Abdelrahman;Timothy Miller;Lane Schwartz
  • 通讯作者:
    Lane Schwartz
Broad-Coverage Parsing Using Human-Like Memory Constraints
使用类似人类的内存约束进行广泛覆盖的解析
  • DOI:
    10.1162/coli.2010.36.1.36100
  • 发表时间:
    2010-03-01
  • 期刊:
  • 影响因子:
    9.3
  • 作者:
    William Schuler;S. Abdelrahman;Timothy Miller;Lane Schwartz
  • 通讯作者:
    Lane Schwartz

William Schuler的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Schuler', 18)}}的其他基金

RI: Small:Comp Cog: Broad-coverage semantic models of human sentence processing
RI:Small:Comp Cog:人类句子处理的广泛覆盖语义模型
  • 批准号:
    1816891
  • 财政年份:
    2018
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
EAGER: Incremental Semantic Sentence Processing Models
EAGER:增量语义句子处理模型
  • 批准号:
    1551313
  • 财政年份:
    2015
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
CAREER: Integrating denotational meaning into probabilistic language models
职业:将指称意义整合到概率语言模型中
  • 批准号:
    0447685
  • 财政年份:
    2005
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Continuing Grant

相似国自然基金

跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MRGPRX2激活“皮肤-神经轴”在非FcεRI介导慢性自发性荨麻疹中的作用及分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
抗体介导的PRRSV感染通过FcγRI抑制I型干扰素产生的分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
  • 批准号:
    2426592
  • 财政年份:
    2024
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
AF:RI:Small: Fairness in allocation and machine learning problems: algorithms and solution concepts
AF:RI:Small:分配公平性和机器学习问题:算法和解决方案概念
  • 批准号:
    2334461
  • 财政年份:
    2024
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
RI: Small: Semantic 3D Neural Rendering Field Models that are Accurate, Complete, Flexible, and Scalable
RI:小型:准确、完整、灵活且可扩展的语义 3D 神经渲染场模型
  • 批准号:
    2312102
  • 财政年份:
    2023
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Continuing Grant
RI: Small: Information-theoretic Multiagent Paths for Anticipatory Control of Tasks (IMPACT)
RI:小:用于任务预期控制的信息论多智能体路径(IMPACT)
  • 批准号:
    2409731
  • 财政年份:
    2023
  • 资助金额:
    $ 48.45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了