基于概率化SC文法的多策略机器翻译研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61201351
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0113.信息获取与处理
  • 结题年份:
    2015
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2015-12-31

项目摘要

Machine Translation (MT) is regarded as a difficult joint research topic. Currently, Rule-based Machine Translation (RBMT) and Statistical Machine Translation (SMT), which respectively embody rationalism and empiricism, have all obtained remarkable achievements and all faced their own challenges. Our proposal, which focused on the merit of both methods, is based on the full-fledged RBMT engine and large scale corpus. First, the probabilistic extension of Sub Category Grammar will be studyed. We will propose a probabilistic extension model of SC Grammar and its parameter estimation algorithm. Then, we will consider how to correct the errors in output of RBMT using SMT engine based on tree to string SMT model, especially on the application of probabilistic extension of Sub Category Grammar. Several hybrid MT schemas will be furtherly designed and analyzed. We wish the quality of translation could be improved by hybrid of RBMT and SMT methods. In summary, this project try to improve current MT techonlogy by creative extentsion of traditional methods and compositive application of distinct algorithms. We believe our study will also be valuable for MT researchs on individual rule-based or statistical methods.
机器翻译是一个多学科交叉的研究领域。目前,分别以理性主义和经验主义思想为指导的规则机器翻译(RBMT)和统计机器翻译(SMT)各自都取得了长足进展,但也都存在着一些固有问题。本项目着眼于二者之长,以较成熟的RBMT引擎、大规模语料库为依托,首先从对SC文法的概率化扩展入手,研究并提出SC文法的概率化扩展模型和对它的参数估计算法;然后,进一步研究如何通过基于树到串模型的SMT方法来自动校正RBMT引擎的错误,特别是如何借助于SC文法概率化扩展来实现SMT对译文质量的综合优化;接下来继续深入研究,设计并分析不同的多策略机器翻译模式,探索如何综合运用统计翻译或规则翻译的处理技术来取得更为优化的译文。本项目力图通过尝试对传统理论的创新扩展和对不同方法的综合运用,实现机器翻译译文质量的改进。同时,本项目的努力,对单独使用规则或统计方法的研究,特别是如何回避、克服的各方法的不足,也都将有所借鉴。

结项摘要

机器翻译是一个多学科交叉的研究领域,分别以理性主义和经验主义思想为指导的RBMT和SMT各自都取得了长足进展,但也都存在着一些固有问题。本项目着眼于二者之长,同时以较成熟的RBMT 引擎和大规模平行语料库为依托,首先从对SC 文法的概率化扩展入手,研究探索了SC 文法的概率化扩展模型和对它的参数估计算法;然后,进一步针对机器翻译中的长句翻译难点问题,研究采用统计学习方法与规则方法的融合,来实现对译文质量的综合优化,提出了基于依存句法的规则匹配切分方法和基于条件随机场(CRF)序列标注的切分方法,并继续深入研究两者的相互补充,共同完成对长句的切分;第三,针对串到树句法翻译模型并没有利用任何语义信息的不足,尝试在串到树模型中引入语义角色信息,提出了两种引入方式(在传统的句法树上添加角色标记,或先构建语义角色树、再在谓词-论元结构内部补充句法信息),使翻译系统能够训练和选择更好的翻译规则, BLEU和NIST分值显著提高;第四,采用多策略融合的原则研究了机器翻译中的空语类问题和词义消岐问题,将领域知识划分为文本领域和词义领域两个层次,提出了一种基于领域知识的图模型词义消歧方法,挖掘领域知识来改善消歧性能,在Koeling数据集上,与已有同类研究相比,我们的方法取得了最佳的消歧效果。总之,本项目力图通过尝试对RBMT传统理论的创新扩展和对SMT方法的综合运用,实现机器翻译译文质量的改进。同时,本项目的努力,对单独使用规则或统计方法的研究,特别是如何回避、克服的各方法的不足,也都将有所借鉴。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(1)
会议论文数量(8)
专利数量(0)
基于词汇语义和句法依存的情感关键句识别 (已录用)
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    冯冲;廖纯;刘至润;黄河燕
  • 通讯作者:
    黄河燕
基于多特征融合的中文比较句识别算法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    刘全超;师超;黄河燕;周海云
  • 通讯作者:
    周海云
基于多特征微博话题情感倾向性判定算法研究
  • DOI:
    10.1103/physrevd.88.045009
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    刘全超;黄河燕;冯冲
  • 通讯作者:
    冯冲
Self-Adaptive Topic Model: A Solution to the Problem of "Rich Topics Get Richer"
自适应主题模型:问题的解决方案
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    China Communications
  • 影响因子:
    4.1
  • 作者:
    Huang Heyan;Jian Ping;Xin Xin;Feng Chong
  • 通讯作者:
    Feng Chong
多策略机器翻译研究综述
  • DOI:
    10.1128/microbiolspec.funk-0034-2016
  • 发表时间:
    2015
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    黄河燕;史树敏;冯冲;苏超
  • 通讯作者:
    苏超

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种新型MEMS器件中的近场辐射传热现象研究
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    传感技术学报
  • 影响因子:
    --
  • 作者:
    冯冲;唐祯安;余隽;薛严冰
  • 通讯作者:
    薛严冰
混合动力客车自适应巡航控制研究
  • DOI:
    10.1063/1.5006477
  • 发表时间:
    2017
  • 期刊:
    汽车工程
  • 影响因子:
    --
  • 作者:
    冯冲;张东好;罗禹贡;李克强
  • 通讯作者:
    李克强
汽车ABS与AFS集成控制算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    江苏大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    冯冲;丁能根;何勇灵
  • 通讯作者:
    何勇灵
基于时空关系的手机定位数据处理方法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    贵州大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    冯冲;左小清;蔡超;黄亮
  • 通讯作者:
    黄亮
复合薄膜热导率测试系统研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    传感器与微系统
  • 影响因子:
    --
  • 作者:
    余隽;吕安新;唐祯安;冯冲
  • 通讯作者:
    冯冲

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码