Word form similarity computation and application in natural language processing

词形相似度​​计算及其在自然语言处理中的应用

基本信息

  • 批准号:
    261284-2007
  • 负责人:
  • 金额:
    $ 1.46万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2011
  • 资助国家:
    加拿大
  • 起止时间:
    2011-01-01 至 2012-12-31
  • 项目状态:
    已结题

项目摘要

In natural language processing, words are often treated as abstract entities divorced from their actual form. However, the actual orthographic or phonetic form of words is an important feature that can be utilized in various tasks. The algorithms that I previously developed for computing word similarity have proven to be effective in a variety of applications, including identification of confusable drug names, and matching person names across different scripts. In the current proposal, I describe how I plan to achieve my two principal research goals: continue developing new measures of similarity, and improve the state-of-the-art in several areas involving sequential processing. With respect to the first goal, my specific objectives are: to propose data-driven learning schemes that integrate many-to-many correspondences and sensitivity to context and to design methods that incorporate linguistic knowledge and require no training data. With respect to the second goal, the areas in which I plan to make an impact are: letter-to-phoneme conversion, machine transliteration, statistical machine translation, and cognate identification. The development and application of word similarity methods leads to a number of challenging research problems, and promises to bring a unifying perspective on several distinct tasks that have so far been perceived as unrelated. Based on the experience of the last few years, I am convinced that this line of research will continue to have an impact beyond the areas of its original application.
在自然语言处理中,单词通常被视为与其实际形式分离的抽象实体。然而,单词的实际拼写或语音形式是一个可以在各种任务中利用的重要特征。我之前开发的用于计算单词相似度的算法已被证明在各种应用中都有效,包括识别易混淆的药物名称以及跨不同文字匹配人名。在当前的提案中,我描述了我计划如何实现我的两个主要研究目标:继续开发新的相似性度量,并提高涉及顺序处理的几个领域的最新技术。对于第一个目标,我的具体目标是:提出集成多对多对应性和上下文敏感性的数据驱动学习方案,并设计结合语言知识且不需要训练数据的方法。关于第二个目标,我计划产生影响的领域是:字母到音素的转换、机器音译、统计机器翻译和同源识别。单词相似性方法的开发和应用导致了许多具有挑战性的研究问题,并有望为迄今为止被认为不相关的几个不同任务带来统一的视角。根据过去几年的经验,我相信这一领域的研究将继续产生超出其原始应用领域的影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kondrak, Grzegorz其他文献

Kondrak, Grzegorz的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kondrak, Grzegorz', 18)}}的其他基金

Overcoming Data Sparsity in Machine Translation
克服机器翻译中的数据稀疏性
  • 批准号:
    RGPIN-2017-05875
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Overcoming Data Sparsity in Machine Translation
克服机器翻译中的数据稀疏性
  • 批准号:
    RGPIN-2017-05875
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Overcoming Data Sparsity in Machine Translation
克服机器翻译中的数据稀疏性
  • 批准号:
    RGPIN-2017-05875
  • 财政年份:
    2019
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Overcoming Data Sparsity in Machine Translation
克服机器翻译中的数据稀疏性
  • 批准号:
    RGPIN-2017-05875
  • 财政年份:
    2018
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Overcoming Data Sparsity in Machine Translation
克服机器翻译中的数据稀疏性
  • 批准号:
    RGPIN-2017-05875
  • 财政年份:
    2017
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Natural Language Processing at the Sub-Word Level
子词级别的自然语言处理
  • 批准号:
    261284-2012
  • 财政年份:
    2016
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Natural Language Processing at the Sub-Word Level
子词级别的自然语言处理
  • 批准号:
    261284-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Natural Language Processing at the Sub-Word Level
子词级别的自然语言处理
  • 批准号:
    261284-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Natural Language Processing at the Sub-Word Level
子词级别的自然语言处理
  • 批准号:
    261284-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Natural Language Processing at the Sub-Word Level
子词级别的自然语言处理
  • 批准号:
    261284-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

考虑农户合作形式与风险偏好的农业补贴机制设计研究
  • 批准号:
    72301193
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
代数群的表示理论及其在Siegel模形式上的应用
  • 批准号:
    12301016
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向不安全代码的形式语义模型与验证研究
  • 批准号:
    62372304
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于线粒体靶向垂钓策略研究珍稀药材山慈菇抗帕金森病的“体内显效形式”及作用机制
  • 批准号:
    82360765
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于事件逻辑理论的安全协议实施安全性形式化分析与验证
  • 批准号:
    62362033
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Critical exponent for nonlinear Schroedinger equations
非线性薛定谔方程的临界指数
  • 批准号:
    23K03160
  • 财政年份:
    2023
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Quasi self-similar transformation for a semilinear heat equation and its application to the solvability
半线性热方程的拟自相似变换及其在可解性中的应用
  • 批准号:
    23K03179
  • 财政年份:
    2023
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Mathematical analyses on predictions and controls for stable structures of free boundaries with feedback-type phase changes
反馈型相变自由边界稳定结构预测与控制的数学分析
  • 批准号:
    20K03672
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on Logical Similarity between Theorems
定理之间的逻辑相似性研究
  • 批准号:
    20K19863
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
非線形放物型方程式系の爆発及び漸近挙動
非线性抛物型方程组的爆炸和渐近行为
  • 批准号:
    20J11261
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了