RI: Small: Collaborative Research: Statistical Learning of Language Universals

RI:小型:协作研究:语言共性的统计学习

基本信息

  • 批准号:
    1337691
  • 负责人:
  • 金额:
    $ 10.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-01-01 至 2015-07-31
  • 项目状态:
    已结题

项目摘要

As modern technology infrastructure spreads throughout the world, the quantity of electronic text, written in hundreds of different languages, continues to grow in size and diversity. Building effective information retrieval, extraction, and translation systems across this vast array of languages currently requires time-consuming and expensive linguistic annotations for each language. Generic, fully unsupervised, methods are unlikely to provide a language independent solution to this problem.Focusing on part-of-speech prediction, this project undertakes a novel approach, combining elements of supervised and unsupervised learning without assuming any specific knowledge of the target language. Instead of treating individual languages as closed systems, language-independent "universals" are statistically estimated from dozens of languages for which annotated corpora exist, and these learned universals are used to predict the part-of-speech categories of unannotated languages. At the heart of the project is a data-driven exploration of language-independent corpus characteristics that relate cross-lingual linguistic categories to surface statistics of text. These learned patterns are incorporated into expressive structured prediction models using novel approximate learning and inference methods developed by the Principal Investigators of the project.Of the world?s spoken languages, hundreds are at risk of immediate extinction and thousands more are likely to disappear over the coming decades. By facilitating the rapid creation of language-independent linguistic analysis tools, the technology developed under this project has the potential to revolutionize the documentation of endangered languages. In the long-term, this research direction will also help realize the full social benefits of the global technology infrastructure by creating intelligent text processing tools for hundreds of low-resource languages.
随着现代技术基础设施在全球范围内传播,用数百种不同语言编写的电子文本数量在规模和多样性上不断增长。当前,跨这种大量语言构建有效的信息检索,提取和翻译系统需要每种语言的时间耗时且昂贵的语言注释。 通用,完全无监督的方法不太可能为此问题提供独立的语言解决方案。专注于言论部分的预测,该项目采用了一种新颖的方法,将受到监督和无监督学习的要素结合在一起,而无需假设目标语言任何特定的知识。 从统计上估计存在带注释的语料库的语言,而不是将单个语言视为封闭的系统,而是统计的“普遍性”,并且这些学识渊博的普遍性用于预测未经通知语言的语言类别。该项目的核心是对与语言无关的语料库特征进行数据驱动的探索,该探索将跨语性语言类别与文本的表面统计数据相关联。这些学识渊博的模式使用该项目的主要研究人员开发的新颖近似学习和推理方法将这些模式纳入了表达性结构化的预测模型中,全世界的口语语言,数百种立即灭绝的风险,而数以千计的人可能会消失。未来几十年。通过促进与语言无关的语言分析工具的快速创建,该项目下开发的技术有可能彻底改变濒危语言的文献。从长远来看,这个研究方向还将通过为数百种低资源语言创建智能文本处理工具来帮助实现全球技术基础设施的全部社会利益。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Luke Zettlemoyer其他文献

Active Learning for Coreference Resolution using Discrete Annotation
使用离散注释主动学习共指消解
  • DOI:
    10.18653/v1/2020.acl-main.738
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Belinda Z. Li;Gabriel Stanovsky;Luke Zettlemoyer
  • 通讯作者:
    Luke Zettlemoyer
Déduction et application d'une grammaire non contextuelle à sujet ciblé
非上下文语法的演绎和应用
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chris Quirk;P. Choudhury;Jurij Ganitkevic;Luke Zettlemoyer
  • 通讯作者:
    Luke Zettlemoyer
Towards Narrative-Centered Learning Environments
走向以叙事为中心的学习环境
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bradford W. Mort;Charles B. Callaway;Luke Zettlemoyer;Seung Y. Lee;James C. Lester
  • 通讯作者:
    James C. Lester
The Belebele Benchmark: a Parallel Reading Comprehension Dataset in 122 Language Variants
Belebele 基准:122 种语言变体的并行阅读理解数据集
  • DOI:
    10.48550/arxiv.2308.16884
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lucas Bandarkar;Davis Liang;Benjamin Muller;Mikel Artetxe;Satya Narayan Shukla;Don Husa;Naman Goyal;Abhinandan Krishnan;Luke Zettlemoyer;Madian Khabsa
  • 通讯作者:
    Madian Khabsa
UW SPF: The University of Washington Semantic Parsing Framework
UW SPF:华盛顿大学语义解析框架
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yoav Artzi;Luke Zettlemoyer
  • 通讯作者:
    Luke Zettlemoyer

Luke Zettlemoyer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Luke Zettlemoyer', 18)}}的其他基金

CAREER: Learning Scalable Models for Grounded Semantic Parsing
职业:学习基础语义解析的可扩展模型
  • 批准号:
    1252835
  • 财政年份:
    2013
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Continuing Grant
RI: Small: Scalable Algorithms for Learning to Recover Logical Form from Natural Language
RI:小型:用于学习从自然语言恢复逻辑形式的可扩展算法
  • 批准号:
    1115966
  • 财政年份:
    2011
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
International Research Fellowship Program: Probabilistic Models for Reasoning in Natural Language Dialog
国际研究奖学金计划:自然语言对话中推理的概率模型
  • 批准号:
    0853021
  • 财政年份:
    2009
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Fellowship

相似国自然基金

诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
  • 批准号:
    82372561
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
  • 批准号:
    82373082
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于胆碱能皮层投射纤维探讨脑小血管病在帕金森病步态障碍中的作用及机制研究
  • 批准号:
    82301663
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
关于丢番图方程小素数解上界估计的研究
  • 批准号:
    12301005
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
嗅球小胶质细胞P2X7受体在变应性鼻炎发生帕金森病样改变中的作用与机制研究
  • 批准号:
    82371119
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 10.99万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了