RI: Small: RUI: Resource-light Morphosyntactic Tagging of Morphologically Complex Languages
RI:小:RUI:形态复杂语言的轻资源形态句法标记
基本信息
- 批准号:0916280
- 负责人:
- 金额:$ 16.92万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This award is funded under the American Recovery and Reinvestment Act of 2009(Public Law 111-5).The main goal of this project is to develop a tagging method which neither relies on target-language training data nor requires bilingual dictionaries and parallel corpora. The main assumption is that a model for the target language can be approximated by language models from one or more related source languages.Exploiting cross-lingual correspondence leads to a better understanding of 1) what linguistic properties are crucial for morphosyntactic transfer; 2) how to measure language similarity at different levels: syntax, lexicon, morphology; 3) how this method applies to pairs that do not belong to the same family; 4) what determines the success of the model, and 5) how to quantify its potential for a given language pair. By exploiting cross-language relationships, the size, and hence cost, of the training data are significantly reduced. This project is a new cross-fertilization between theoretical linguistics (especially typology and diachronic linguistics) and natural language processing. The practical contribution is a robust and portable system for tagging resource-poor languages. With this new approach, it is be possible to rapidly deploy tools to analyze a suddenly critical language. This approach can also enhance NSF's initiatives in documenting endangered low density languages as it leverages exactly the type of knowledge that a field linguist and a native speaker could provide. Additional benefits include high quality annotated data, automatically derived multilingual lexicons, annotation schemes for new languages, new typological generalizations, and graduate and undergraduate researchers with significant experience of highly practical work on difficult and underrepresented languages.
该奖项由2009年美国复苏与再投资法案(公法111-5)资助。该项目的主要目标是开发一种既不依赖目标语言训练数据,又不需要双语词典和平行语料库的标注方法。 主要假设是目标语言的模型可以通过一种或多种相关源语言的语言模型来近似。利用跨语言对应可以更好地理解:1)哪些语言特性对于形态句法迁移至关重要; 2)如何衡量不同层面的语言相似度:语法、词汇、词法; 3)该方法如何适用于不属于同一家族的配对; 4) 决定模型成功的因素是什么,以及 5) 如何量化其对于给定语言对的潜力。通过利用跨语言关系,训练数据的大小和成本都显着减少。该项目是理论语言学(特别是类型学和历时语言学)和自然语言处理之间的新交叉。实际的贡献是一个强大且可移植的系统,用于标记资源匮乏的语言。通过这种新方法,可以快速部署工具来分析突然变得关键的语言。这种方法还可以增强 NSF 在记录濒危低密度语言方面的举措,因为它恰好利用了现场语言学家和母语人士可以提供的知识类型。其他好处包括高质量的注释数据、自动生成的多语言词典、新语言的注释方案、新的类型概括,以及在困难和代表性不足的语言方面具有高度实际工作经验的研究生和本科生研究人员。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Anna Feldman其他文献
WordPrep: Word-based Preposition Prediction Tool
WordPrep:基于单词的介词预测工具
- DOI:
10.1109/bigdata47090.2019.9005608 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Pooja Bhagat;A. Varde;Anna Feldman - 通讯作者:
Anna Feldman
Experiments in Cross-Language Morphological Annotation Transfer
跨语言形态注释迁移实验
- DOI:
10.1007/11671299_4 - 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Anna Feldman;Jirka Hana;Chris Brew - 通讯作者:
Chris Brew
Evaluating and automating the annotation of a learner corpus
评估和自动化学习者语料库的注释
- DOI:
10.1007/s10579-013-9226-3 - 发表时间:
2013 - 期刊:
- 影响因子:2.7
- 作者:
Alexandr Rosen;Jirka Hana;Barbora Stindlová;Anna Feldman - 通讯作者:
Anna Feldman
Legend at ArAIEval Shared Task: Persuasion Technique Detection using a Language-Agnostic Text Representation Model
ArAIEval 共享任务的传奇:使用与语言无关的文本表示模型进行说服技术检测
- DOI:
10.48550/arxiv.2310.09661 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
O. E. Ojo;O. O. Adebanji;Hiram Calvo;Damian O. Dieke;Olumuyiwa E. Ojo;S.E. Akinsanya;Tolulope O. Abiola;Anna Feldman - 通讯作者:
Anna Feldman
Linguistic Fingerprints of Internet Censorship: the Case of SinaWeibo
互联网审查的语言指纹:以新浪微博为例
- DOI:
10.1609/aaai.v34i01.5381 - 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Kei Yin Ng;Anna Feldman;Jing Peng - 通讯作者:
Jing Peng
Anna Feldman的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Anna Feldman', 18)}}的其他基金
RI: Small: DaRE: Detection and Recognition of Euphemisms
RI:小:DaRE:委婉语的检测和识别
- 批准号:
2226006 - 财政年份:2023
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
Workshop on Natural Language Processing for Internet Freedom
自然语言处理促进互联网自由研讨会
- 批准号:
1828199 - 财政年份:2018
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
Student Support at the North American Association for Computational Linguistics Workshop on Computational Methods for Analysis of Narrative
北美计算语言学协会叙事分析计算方法研讨会的学生支持
- 批准号:
1523285 - 财政年份:2015
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
RI: Small: RUI: AIR: Automatic Idiom Recognition
RI:小:RUI:AIR:自动成语识别
- 批准号:
1319846 - 财政年份:2013
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
Undergraduate Research: Cross-Lingual Approaches to Morphosyntactic Tagging
本科生研究:形态句法标记的跨语言方法
- 批准号:
1033275 - 财政年份:2010
- 资助金额:
$ 16.92万 - 项目类别:
Continuing Grant
RI:EAGER: A Montclair Group in Cognitive and Computational Aspects of Language and Speech Processing: An Exploration
RI:EAGER:蒙特克莱尔小组在语言和语音处理的认知和计算方面:探索
- 批准号:
1048406 - 财政年份:2010
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
Workshop on Computational Approaches to Linguistic Creativity - Element 7495
语言创造力计算方法研讨会 - 元素 7495
- 批准号:
0906244 - 财政年份:2009
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
相似国自然基金
单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
- 批准号:82304883
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
- 批准号:32372613
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
- 批准号:82372561
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
- 批准号:82373082
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
- 批准号:82373304
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
RI: Small: Collaborative Research: RUI: Influence Games: A Game-Theoretic Approach to Strategic Behavior in Networks
RI:小型:协作研究:RUI:影响游戏:网络中战略行为的博弈论方法
- 批准号:
1910203 - 财政年份:2019
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
RI: Small: RUI: Automated Reasoning about Time -- Methods and Analysis
RI:小:RUI:关于时间的自动推理——方法与分析
- 批准号:
1909739 - 财政年份:2019
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: RUI: Scalable Decentralized Planning in Open Multiagent Environments
RI:小型:协作研究:RUI:开放多代理环境中的可扩展去中心化规划
- 批准号:
1909513 - 财政年份:2019
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
RI: Small: RUI: Benchmarks and Algorithms for Mobile Image Matching
RI:小型:RUI:移动图像匹配的基准和算法
- 批准号:
1718376 - 财政年份:2017
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant
RI: Small: RUI: Synthesis of Robust Artificial Systems by Adaptive Genetic Programming
RI:小型:RUI:通过自适应遗传编程合成稳健的人工系统
- 批准号:
1617087 - 财政年份:2016
- 资助金额:
$ 16.92万 - 项目类别:
Standard Grant