RI: Small: Exploiting Bilingual Resources to Improve Monolingual Syntactic Tools

RI:小型:利用双语资源改进单语句法工具

基本信息

  • 批准号:
    0915265
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-15 至 2010-08-31
  • 项目状态:
    已结题

项目摘要

Natural language processing systems currently degrade when used outside of their training domains and languages. However, when text is analyzed along with translations into another language, the two languages provide powerful constraints on each other. For example, a syntactic construction which is ambiguous in one language may be unambiguous in another. We exploit such constraints by using multilingual models that capture the ways in which linguistic structures correspond between one language and another. These models are then used to accurately analyze both sides of parallel texts, which can in turn be used to train new, better, models for each language alone. Multilingual models are challenging because each language alone is complex, and the correspondences between languages can include deep syntactic and semantic restructurings. Focusing on syntactic parsing, we address these complexities with a hierarchy of increasingly complex models, each constraining the next. Our approach of multilingual analysis improves three technologies: resource projection, wherein tools for resource-rich languages are transferred to resource-poor ones, domain adaptation, wherein tools are transferred from one domain to another, and multilingual alignment, wherein correspondences between languages are extracted for use in machine translation pipelines. In addition to publishing the research results from this work, we also make freely available the multilingual modeling tools we develop.
目前,自然语言处理系统在其训练领域和语言之外使用时会出现性能下降。 然而,当分析文本并翻译成另一种语言时,这两种语言相互之间产生了强大的约束。 例如,在一种语言中模糊的句法结构在另一种语言中可能是明确的。 我们通过使用多语言模型来利用这些限制,这些模型捕获一种语言与另一种语言之间的语言结构对应的方式。 然后,这些模型用于准确分析并行文本的两侧,进而可以用于单独为每种语言训练新的、更好的模型。 多语言模型具有挑战性,因为每种语言都很复杂,并且语言之间的对应关系可能包括深层句法和语义重组。 专注于句法解析,我们通过日益复杂的模型层次结构来解决这些复杂性,每个模型都约束下一个模型。 我们的多语言分析方法改进了三项技术:资源投影(将资源丰富语言的工具转移到资源贫乏的语言)、领域适应(将工具从一个领域转移到另一个领域)以及多语言对齐(提取语言之间的对应关系)用于机器翻译管道。 除了发布这项工作的研究成果之外,我们还免费提供我们开发的多语言建模工具。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dan Klein其他文献

Prompted Contextual Vectors for Spear-Phishing Detection
用于鱼叉式网络钓鱼检测的提示上下文向量
  • DOI:
    10.48550/arxiv.2402.08309
  • 发表时间:
    2024-02-13
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel Nahmias;Gal Engelberg;Dan Klein;A. Shabtai
  • 通讯作者:
    A. Shabtai
Efficacy of Language Model Self-Play in Non-Zero-Sum Games
非零和博弈中语言模型自博的有效性
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Austen Liao;Nicholas Tomlin;Dan Klein
  • 通讯作者:
    Dan Klein
Corpus-Based Induction of Syntactic Structure : Models of Constituency and Dependency
基于语料库的句法结构归纳:选区和依存模型
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dan Klein;Christopher D. Manning
  • 通讯作者:
    Christopher D. Manning
Beyond Performance: Quantifying and Mitigating Label Bias in LLMs
超越绩效:量化和减轻法学硕士中的标签偏见
  • DOI:
    10.48550/arxiv.2405.02743
  • 发表时间:
    2024-05-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philipp Benz;Chaoning Zhang;Adil Karjauv;In So;Tom Brown;Benjamin Mann;Nick Ryder;Jared D Subbiah;Prafulla Kaplan;A. Dhariwal;P. Neelakantan;Girish Shyam;Am;a Sastry;a;Y;a Chen;a;Chen Zhao;Zhou Yu;Kathleen McK;Francesco Croce;Maksym Andriushchenko;Edoardo Debenedetti;Nicolas Flammarion;Mung Chiang;Prateek Mittal;Matthias Hein;Yeganeh 09770 labashi;Amirreza Kordi;Mirzaei;Atharva;Arjun Naik;Arut Selvan Ashok;Dhanasekaran;Anjana Arunkumar;David Stap;Eshaan Pathak;Giannis Karamanolakis;H. Lai;Ishan Puro;Ishani Mondal;Jacob Anderson;Kirby Kuznia;Krima Doshi;Kuntal Kumar Pal;Maitreya Patel;M. Moradshahi;Mihir Parmar;Mirali Purohit;Shailaja Keyur Sampat;Sid Mishra;Sujan;Sumanta Patro;Tanay Dixit;Jason Wei;Maarten Bosma;Vincent Y. Zhao;Kelvin Guu;Adams Wei Yu;Brian Lester;Nan Du;Andrew M. Dai;Quoc V. Le;Finetuned;Jerry Wei;Yi Tay;Dustin Tran;Yifeng Webson;Xinyun Lu;Hanxiao Chen;Liu;Thomas Wolf;Lys;re Debut;re;Julien Victor Sanh;Clement Chaumond;Anthony Delangue;Pier;Tim ric Cistac;Rémi Rault;Morgan Louf;Funtow;Sam Davison;Patrick Shleifer;V. Platen;Clara Ma;Yacine Jernite;J. Plu;Canwen Xu;Zihao Zhao;Eric Wallace;Shi Feng;Dan Klein;Han Zhou;Xingchen Wan;Lev Proleev;Diana Mincu;Jilin Chen;Katherine A. Heller
  • 通讯作者:
    Katherine A. Heller
A Vision-free Baseline for Multimodal Grammar Induction
多模态语法归纳的无视觉基线
  • DOI:
    10.23919/jcc.2020.12.018
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    4.1
  • 作者:
    Boyi Li;Rodolfo Corona;K. Mangalam;Catherine Chen;Daniel Flaherty;Serge Belongie;Kilian Q. Weinberger;Jitendra Malik;Trevor Darrell;Dan Klein;Uc Berkeley
  • 通讯作者:
    Uc Berkeley

Dan Klein的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dan Klein', 18)}}的其他基金

RI: Small: Collaborative Research: Unsupervised Transcription of Early Modern Documents
RI:小型:合作研究:早期现代文献的无监督转录
  • 批准号:
    1618460
  • 财政年份:
    2016
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI: Small: Probabilistic Models for Reconstructing Ancient Languages
RI:小:重建古代语言的概率模型
  • 批准号:
    1018733
  • 财政年份:
    2010
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
CAREER: Discriminative, Syntactic Machine Translation
职业:判别式句法机器翻译
  • 批准号:
    0643742
  • 财政年份:
    2006
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant

相似国自然基金

ALKBH5介导的SOCS3-m6A去甲基化修饰在颅脑损伤后小胶质细胞炎性激活中的调控作用及机制研究
  • 批准号:
    82301557
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miRNA前体小肽miPEP在葡萄低温胁迫抗性中的功能研究
  • 批准号:
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
PKM2苏木化修饰调节非小细胞肺癌起始细胞介导的耐药生态位的机制研究
  • 批准号:
    82372852
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于翻译组学理论探究LncRNA H19编码多肽PELRM促进小胶质细胞活化介导电针巨刺改善膝关节术后疼痛的机制研究
  • 批准号:
    82305399
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CLDN6高表达肿瘤细胞亚群在非小细胞肺癌ICB治疗抗性形成中的作用及机制研究
  • 批准号:
    82373364
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

RI: Small: Exploiting Symmetries of Decision-Theoretic Planning for Autonomous Vehicles
RI:小:利用自动驾驶车辆决策理论规划的对称性
  • 批准号:
    2006886
  • 财政年份:
    2020
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI: Small: Learning Resilient Autonomous Flight Behaviors by Exploiting Collision-tolerance
RI:小:通过利用碰撞容忍度来学习弹性自主飞行行为
  • 批准号:
    2008904
  • 财政年份:
    2020
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI: Small: Exploiting Global Structure in Robot Decision Problems
RI:小:在机器人决策问题中利用全局结构
  • 批准号:
    2002492
  • 财政年份:
    2019
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI: Small: Exploiting Global Structure in Robot Decision Problems
RI:小:在机器人决策问题中利用全局结构
  • 批准号:
    1816540
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI:Small:Exploiting the Evolving Conditioning of Bundle Adjustment for Robust, Adaptive Simultaneous Localization and Mapping
RI:Small:利用束调整的演化条件实现鲁棒、自适应同步定位和绘图
  • 批准号:
    1816138
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了