CAREER: Robust Parsing for New Domains and Languages

职业:新领域和语言的稳健解析

基本信息

  • 批准号:
    0745914
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-07-01 至 2014-06-30
  • 项目状态:
    已结题

项目摘要

To facilitate linguistic communications, natural language processing (NLP) technologies must be applicable to different languages across different domains. A limitation of many NLP systems is that they do not perform as well on data types that diverge from their training examples. The objective of this CAREER project is to increase the robustness and coverage of a fundamental NLP component, the syntactic parser.Specifically, this project explores adaptation methods to extend a standard English parser for processing different domains (e.g., scientific literature, emails) and different languages (e.g., Chinese). Three types of correspondences are considered. First, if coarse-level correspondences are explicit in the data (e.g., bilingual documents), finer-grained correspondences at the word- or phrasal-level may be inferred, and semi-supervised learning may be used to transfer domain knowledge across the inferred correspondence.Second, if the correspondences are inexact (e.g., multiple translations of varying quality), the mis-matched portions may be identified and transformed to achieve a closer mapping. Third, if the correspondences are indirect, methods for inducing correspondences from non-parallel corpora may be appropriate.Parser adaptation stands to increase the range of NLP applications; examples include: data mining from medical documents and automatic tutoring for non-English speakers. As the project aims to bring together several strands of research, it offers ample research opportunities to graduate and undergraduate students. The algorithmic aspects encourage forming synthesis from areas of semi-supervised learning, relational data modeling, grammar induction, and machine translation; the empirical aspects afford students an arena to hone their skills in good scientific methodologies.
为了促进语言交流,自然语言处理(NLP)技术必须适用于不同领域的不同语言。 许多NLP系统的局限性在于,它们在与培训示例不同的数据类型上表现不佳。该职业项目的目的是提高基本NLP组件的鲁棒性和覆盖范围,即句法解析器。具体来说,该项目探讨了适应方法,以扩展用于处理不同域(例如,科学文献,电子邮件)和不同语言(例如,不同语言)(例如,中文)的标准英语解析器。 考虑了三种类型的对应关系。 First, if coarse-level correspondences are explicit in the data (e.g., bilingual documents), finer-grained correspondences at the word- or phrasal-level may be inferred, and semi-supervised learning may be used to transfer domain knowledge across the inferred correspondence.Second, if the correspondences are inexact (e.g., multiple translations of varying quality), the mis-matched portions may be identified and transformed to achieve近距离映射。 第三,如果对应关系是间接的,则可能适当诱导非并行语料库的对应关系的方法。Parser Adaptation将增加NLP应用程序的范围;示例包括:来自医疗文档的数据挖掘和非英语扬声器的自动辅导。 该项目旨在汇集一些研究,它为研究生和本科生提供了充足的研究机会。 算法方面鼓励从半监督学习,关系数据建模,语法诱导和机器翻译的领域形成合成;经验方面为学生提供了一个竞技场,可以在良好的科学方法论中磨练自己的技能。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rebecca Hwa其他文献

Topological considerations in the generation of scroll waves in excitable and cyclical media
在可兴奋和循环介质中产生滚动波的拓扑考虑
  • DOI:
    10.1016/0167-2789(94)90300-x
  • 发表时间:
    1994
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N. Otani;Rebecca Hwa
  • 通讯作者:
    Rebecca Hwa

Rebecca Hwa的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rebecca Hwa', 18)}}的其他基金

IPA Action
IPA 行动
  • 批准号:
    1935188
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Intergovernmental Personnel Award
EAGER: Computational Models of Essay Rewritings
EAGER:论文重写的计算模型
  • 批准号:
    1550635
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative: Discriminative Knowledge-Rich Language Modeling for Machine Translation
协作:用于机器翻译的判别性知识丰富的语言建模
  • 批准号:
    0712810
  • 财政年份:
    2007
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Student Research Workshop in Computational Linguistics, at the COLING-ACL 2006 Conference
计算语言学学生研究研讨会,COLING-ACL 2006 会议
  • 批准号:
    0612690
  • 财政年份:
    2006
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SGER: Learning Syntax-based Evaluation Metrics for Machine Translation
SGER:学习基于语法的机器翻译评估指标
  • 批准号:
    0612791
  • 财政年份:
    2006
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

强壮前沟藻共生细菌降解膦酸酯产生促藻效应的分子机制
  • 批准号:
    42306167
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高效率强壮消息鉴别码的分析与设计
  • 批准号:
    61202422
  • 批准年份:
    2012
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
半定松弛与非凸二次约束二次规划研究
  • 批准号:
    11271243
  • 批准年份:
    2012
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于复合编码脉冲串的水下主动隐蔽性探测新方法研究
  • 批准号:
    61271414
  • 批准年份:
    2012
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
民航客运网络收益管理若干问题的研究
  • 批准号:
    60776817
  • 批准年份:
    2007
  • 资助金额:
    20.0 万元
  • 项目类别:
    联合基金项目

相似海外基金

Robust Three-Dimensional Pattern Recognition based on Object Oriented Data Analysis
基于面向对象数据分析的鲁棒三维模式识别
  • 批准号:
    23K16900
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Non-regular robust methods for locally stationary generalized unit root related processes and their applications to large-scale data
局部平稳广义单位根相关过程的非正则鲁棒方法及其在大规模数据中的应用
  • 批准号:
    23K11004
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of Robust Breath Odor Analysis Based on Ensemble Analysis of Odor Sensing Data
基于气味传感数据集成分析的鲁棒呼吸气味分析的开发
  • 批准号:
    22K19892
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Improvement of prediction accuracy of advanced reactors: Precise and robust cross section adjustment method based on active subspace approach
先进反应堆预测精度的提高:基于主动子空间方法的精确鲁棒截面调整方法
  • 批准号:
    21K04940
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Robust and Efficient Numerical Methods for Matrix Problems with Singularity
奇异性矩阵问题的鲁棒高效数值方法
  • 批准号:
    20K14356
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了