EAGER: PARTIAL: An Exploratory Study on Practical Approaches for Robust NLP Tools with Integrated Annotation Languages

EAGER: PARTIAL:关于具有集成注释语言的鲁棒 NLP 工具实用方法的探索性研究

基本信息

  • 批准号:
    1352440
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

In order to develop natural language processing (NLP) technologies for text in a wider range of languages, dialects, genres, and styles, this Early Grant for Exploratory Research investigates a novel methodological approach. Conventionally, linguistic experts are employed to create gold-standard linguistically annotated datasets to which supervised machine learning algorithms are applied. This project frees annotators from the requirement that annotations be complete by moving more of the burden to learning algorithms. Algorithms are developed that are robust to partial evidence, annotator variation, and noise due to errors. As a result, any language enthusiast (not just trained experts) can provide annotations so that NLP can be developed for more kinds of text in more languages for less money. In this exploration, the focus is on dependency parsing, a fundamental NLP component that predicts the grammatical relationships between words in sentences, with experimentation on data in English (two genres), Chinese, and Farsi. The formal basis for the approach is a framework called Graph Fragment Language (GFL). The project assesses the quality of parsers learned from GFL and the productivity of annotators accorded this new flexibility.Beyond documentation and assessment of the new methodology, this project produces open-source software tools for gathering annotated data and constructing NLP tools using the data. It emphasizes the usability of these tools in classrooms, contributing exercises that can be used in NLP and linguistics courses to allow students to engage directly with data, with the models that make use of the data, and with the technological goals that data annotation supports.
为了开发自然语言处理(NLP)技术,以更广泛的语言,方言,流派和样式范围,这项早期的探索性研究授予研究了一种新颖的方法论方法。 通常,使用语言专家来创建金标准的语言注释的数据集,并将其应用于监督的机器学习算法。 该项目可以通过将更多的负担转移到学习算法来完成注释的要求中释放注释。开发了对部分证据,注释者变异和由于错误而稳健的算法。 结果,任何语言爱好者(不仅是训练有素的专家)都可以提供注释,因此可以以更少的钱为更多语言开发NLP。 在此探索中,重点是依赖解析,这是一种基本的NLP组件,可以预测句子中单词之间的语法关系,并对英语(两种类型),中文和Farsi进行了实验。 该方法的形式基础是称为图形片段语言(GFL)的框架。 该项目评估了从GFL学到的解析器的质量以及注释者的生产率。签署了这种新的灵活性。Beyond文档和新方法的评估,该项目生产开源软件工具,用于收集注释数据并使用数据构建NLP工具。 它强调了这些工具在课堂上的可用性,可以在NLP和语言学课程中使用的练习,以使学生可以直接与数据,使用数据的模型以及数据注释支持的技术目标。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Noah Smith其他文献

THE NORTH ATLANTIC TREATY ORGANIZATION AND UNITED STATES RELATIONSHIP: A STUDY OF ITS DEVELOPMENT AND POSSIBLE FUTURE
北大西洋公约组织与美国的关系:对其发展和可能的未来的研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Buying health: assessing the impact of a consumer-side vegetable subsidy on purchasing, consumption and waste
购买健康:评估消费者侧蔬菜补贴对购买、消费和浪费的影响
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Implications for cumulative and prolonged clinical improvement induced by cross-linked hyaluronic acid: An in vivo biochemical/microscopic study in humans.
交联透明质酸诱导的累积和长期临床改善的影响:人类体内生化/显微镜研究。
  • DOI:
    10.1111/exd.14998
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Frank Wang;T. Do;Noah Smith;J. Orringer;Sewon Kang;John J Voorhees;Gary J. Fisher
  • 通讯作者:
    Gary J. Fisher
Biopsy of Suspected Melanoma
疑似黑色素瘤活检
  • DOI:
    10.1007/978-3-319-46029-1_10-1
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith;T. Johnson;J. Kelly;A. Sober;C. Bichakjian
  • 通讯作者:
    C. Bichakjian
How party nationalization conditions economic voting
  • DOI:
    10.1016/j.electstud.2016.11.014
  • 发表时间:
    2017-06-01
  • 期刊:
  • 影响因子:
  • 作者:
    Scott Morgenstern;Noah Smith;Alejandro Trelles
  • 通讯作者:
    Alejandro Trelles

Noah Smith的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Noah Smith', 18)}}的其他基金

NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
  • 批准号:
    2113530
  • 财政年份:
    2021
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI/SES: Conference Proposal: Doctoral Consortium on Text as Data
RI/SES:会议提案:文本即数据博士联盟
  • 批准号:
    1830158
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
  • 批准号:
    1813153
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
RI: Medium: Broad-Coverage Semantic Parsing: Linguistic Representation Learning from Crowd-Scale Data
RI:中:广泛覆盖的语义解析:从人群规模数据中学习语言表示
  • 批准号:
    1562364
  • 财政年份:
    2016
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
Workshop: Support for a workshop on scientific research applications of natural language technologies
研讨会:支持自然语言技术科研应用研讨会
  • 批准号:
    1433108
  • 财政年份:
    2014
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SoCS: Collaborative Research: Data-Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于发现和分析框架的数据驱动计算模型
  • 批准号:
    1211277
  • 财政年份:
    2012
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
CAREER: Flexible Learning for Natural Language Processing
职业:自然语言处理的灵活学习
  • 批准号:
    1054319
  • 财政年份:
    2011
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
RI-Small: Probabilistic Models for Structure Discovery in Text
RI-Small:文本结构发现的概率模型
  • 批准号:
    0915187
  • 财政年份:
    2009
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
SGER: Scaling up unsupervised grammar induction
SGER:扩大无监督语法归纳
  • 批准号:
    0836431
  • 财政年份:
    2008
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant

相似国自然基金

部分可观测连续时间马氏决策过程若干风险准则的最优控制问题研究
  • 批准号:
    12361091
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目
海底管道尾部分离板减阻、抑振、降湍流三重功效的最优控制机理研究
  • 批准号:
    52301341
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
部分相干特殊结构光场在高超声速湍流场中的传输特性研究
  • 批准号:
    62305383
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于部分相干理论的极紫外光刻掩模相位型缺陷三维形貌检测方法
  • 批准号:
    62374167
  • 批准年份:
    2023
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
气候条件和碳供给对我国湿润亚热带地区典型针叶树种木质部分化的影响
  • 批准号:
    42301058
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

頭頸部粘膜悪性黒色腫の分子生物学的アプローチによる治療標的および予後因子の探索
使用分子生物学方法寻找头颈部粘膜恶性黑色素瘤的治疗靶点和预后因素
  • 批准号:
    24K12662
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Elucidating the pathogenesis of demyelinating type of Guillain Barre syndrome.
阐明脱髓鞘型格林巴利综合征的发病机制。
  • 批准号:
    19K07815
  • 财政年份:
    2019
  • 资助金额:
    $ 10万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Behavior Model Reflecting Dynamical Values of Humans using Inverse Bayesian Inference
使用逆贝叶斯推理反映人类动态价值的行为模型
  • 批准号:
    18K11458
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Neuroendocrinology of Social Behavior
社会行为神经内分泌学
  • 批准号:
    15H05724
  • 财政年份:
    2015
  • 资助金额:
    $ 10万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
The Spatial Scale and Cellular Mechanisms of Neurovascular Coupling in vivo
体内神经血管耦合的空间尺度和细胞机制
  • 批准号:
    8771893
  • 财政年份:
    2014
  • 资助金额:
    $ 10万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了