RI: Small: RUI: Resource-light Morphosyntactic Tagging of Morphologically Complex Languages

RI:小:RUI:形态复杂语言的轻资源形态句法标记

基本信息

  • 批准号:
    0916280
  • 负责人:
  • 金额:
    $ 16.92万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2013-08-31
  • 项目状态:
    已结题

项目摘要

This award is funded under the American Recovery and Reinvestment Act of 2009(Public Law 111-5).The main goal of this project is to develop a tagging method which neither relies on target-language training data nor requires bilingual dictionaries and parallel corpora. The main assumption is that a model for the target language can be approximated by language models from one or more related source languages.Exploiting cross-lingual correspondence leads to a better understanding of 1) what linguistic properties are crucial for morphosyntactic transfer; 2) how to measure language similarity at different levels: syntax, lexicon, morphology; 3) how this method applies to pairs that do not belong to the same family; 4) what determines the success of the model, and 5) how to quantify its potential for a given language pair. By exploiting cross-language relationships, the size, and hence cost, of the training data are significantly reduced. This project is a new cross-fertilization between theoretical linguistics (especially typology and diachronic linguistics) and natural language processing. The practical contribution is a robust and portable system for tagging resource-poor languages. With this new approach, it is be possible to rapidly deploy tools to analyze a suddenly critical language. This approach can also enhance NSF's initiatives in documenting endangered low density languages as it leverages exactly the type of knowledge that a field linguist and a native speaker could provide. Additional benefits include high quality annotated data, automatically derived multilingual lexicons, annotation schemes for new languages, new typological generalizations, and graduate and undergraduate researchers with significant experience of highly practical work on difficult and underrepresented languages.
该奖项是根据2009年的《美国回收与再投资法》(公法111-5)资助的。该项目的主要目标是开发一种标记方法,该方法既不依赖于目标语言培训数据,也不需要双语词典和平行语料库。 主要的假设是,目标语言的模型可以通过一种或多种相关源语言的语言模型近似。探索跨语言对应性可以更好地理解1)哪些语言属性对于形态词法转移至关重要; 2)如何在不同层面上衡量语言相似性:语法,词典,形态; 3)这种方法如何适用于不属于同一家族的对; 4)什么决定了模型的成功,以及5)如何量化其对给定语言对的潜力。通过利用跨语言关系,训练数据的大小和成本大大降低。该项目是理论语言学(尤其是类型学和历时语言学)和自然语言处理之间的新跨批准。实际的贡献是一个可靠的便携式系统,用于标记资源贫乏的语言。通过这种新方法,可以快速部署工具来分析突然的关键语言。这种方法还可以增强NSF在记录濒临灭绝的低密度语言方面的举措,因为它准确地利用了现场语言学家和母语者可以提供的知识类型。其他好处包括高质量的注释数据,自动衍生的多语言词典,新语言的注释方案,新的类型学概括以及研究生和本科研究人员,在困难和代表性不足的语言方面具有丰富的实用性经验。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Anna Feldman其他文献

WordPrep: Word-based Preposition Prediction Tool
WordPrep:基于单词的介词预测工具
Experiments in Cross-Language Morphological Annotation Transfer
跨语言形态注释迁移实验
  • DOI:
    10.1007/11671299_4
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anna Feldman;Jirka Hana;Chris Brew
  • 通讯作者:
    Chris Brew
Evaluating and automating the annotation of a learner corpus
评估和自动化学习者语料库的注释
  • DOI:
    10.1007/s10579-013-9226-3
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Alexandr Rosen;Jirka Hana;Barbora Stindlová;Anna Feldman
  • 通讯作者:
    Anna Feldman
Legend at ArAIEval Shared Task: Persuasion Technique Detection using a Language-Agnostic Text Representation Model
ArAIEval 共享任务的传奇:使用与语言无关的文本表示模型进行说服技术检测
  • DOI:
    10.48550/arxiv.2310.09661
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    O. E. Ojo;O. O. Adebanji;Hiram Calvo;Damian O. Dieke;Olumuyiwa E. Ojo;S.E. Akinsanya;Tolulope O. Abiola;Anna Feldman
  • 通讯作者:
    Anna Feldman
Linguistic Fingerprints of Internet Censorship: the Case of SinaWeibo
互联网审查的语言指纹:以新浪微博为例

Anna Feldman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Anna Feldman', 18)}}的其他基金

RI: Small: DaRE: Detection and Recognition of Euphemisms
RI:小:DaRE:委婉语的检测和识别
  • 批准号:
    2226006
  • 财政年份:
    2023
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
Workshop on Natural Language Processing for Internet Freedom
自然语言处理促进互联网自由研讨会
  • 批准号:
    1828199
  • 财政年份:
    2018
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
Student Support at the North American Association for Computational Linguistics Workshop on Computational Methods for Analysis of Narrative
北美计算语言学协会叙事分析计算方法研讨会的学生支持
  • 批准号:
    1523285
  • 财政年份:
    2015
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
RI: Small: RUI: AIR: Automatic Idiom Recognition
RI:小:RUI:AIR:自动成语识别
  • 批准号:
    1319846
  • 财政年份:
    2013
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
Undergraduate Research: Cross-Lingual Approaches to Morphosyntactic Tagging
本科生研究:形态句法标记的跨语言方法
  • 批准号:
    1033275
  • 财政年份:
    2010
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Continuing Grant
RI:EAGER: A Montclair Group in Cognitive and Computational Aspects of Language and Speech Processing: An Exploration
RI:EAGER:蒙特克莱尔小组在语言和语音处理的认知和计算方面:探索
  • 批准号:
    1048406
  • 财政年份:
    2010
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
Workshop on Computational Approaches to Linguistic Creativity - Element 7495
语言创造力计算方法研讨会 - 元素 7495
  • 批准号:
    0906244
  • 财政年份:
    2009
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant

相似国自然基金

基于小增益理论的物联网聚合计算鲁棒稳定性分析
  • 批准号:
    62303112
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于鲁棒广义短路比的高比例新能源电力系统数据驱动随机小干扰稳定性分析
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
Ibrutinib下调MDSCs逆转PD-1抗体治疗晚期非小细胞肺癌耐药的机制探究
  • 批准号:
    81702268
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于小波-卡尔曼滤波的二维离散随机系统鲁棒H∞控制
  • 批准号:
    61603034
  • 批准年份:
    2016
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
密集无线网络分布式和鲁棒性传输理论与方法
  • 批准号:
    61571107
  • 批准年份:
    2015
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目

相似海外基金

RI: Small: Collaborative Research: RUI: Influence Games: A Game-Theoretic Approach to Strategic Behavior in Networks
RI:小型:协作研究:RUI:影响游戏:网络中战略行为的博弈论方法
  • 批准号:
    1910203
  • 财政年份:
    2019
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
RI: Small: RUI: Automated Reasoning about Time -- Methods and Analysis
RI:小:RUI:关于时间的自动推理——方法与分析
  • 批准号:
    1909739
  • 财政年份:
    2019
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: RUI: Scalable Decentralized Planning in Open Multiagent Environments
RI:小型:协作研究:RUI:开放多代理环境中的可扩展去中心化规划
  • 批准号:
    1909513
  • 财政年份:
    2019
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
RI: Small: RUI: Benchmarks and Algorithms for Mobile Image Matching
RI:小型:RUI:移动图像匹配的基准和算法
  • 批准号:
    1718376
  • 财政年份:
    2017
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
RI: Small: RUI: Synthesis of Robust Artificial Systems by Adaptive Genetic Programming
RI:小型:RUI:通过自适应遗传编程合成稳健的人工系统
  • 批准号:
    1617087
  • 财政年份:
    2016
  • 资助金额:
    $ 16.92万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了