基于主干成分的句法统计机器翻译模型研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61300097
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    28.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2016
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2016-12-31

项目摘要

Statistical Machine Translaiton (SMT) is one of the most important sub-fields in Natural Langauge Processing (NLP). While several methods have been succesfully developed in recent years, it is worth investigating new models that make better use of structures in (source-language) sentences as well as the skeleton information encoded in translation. In this proposal we study the skeleton-based model for syntactic statistical machine translation. The problems we address include automatic identification of chinese skeleton, the skeleton-based syntactic statistical translation model, training and decoding for skeleton-based statistical machine translation. The proposed methods/models make benefits from data-driven methods and the prior knowledge in real-world translation. This work is inspired and supported by the previous work of our group (Natural Language Processing Lab, Northeastern University). All the techniques developed in the project will be integrated into the NiuTrans open-source statistical machine translation system, which will be released to public under the support of this project.
统计机器翻译是当今自然语言处理领域的重要研究课题之一。虽然近些年来已经有一些成功的统计机器翻译模型被提出,如何更加充分的利用(源语言)句子的结构信息及句子主干信息来进一步提高翻译性能仍是十分重要且有待研究的科学问题。本课题研究基于主干成分的句法统计机器翻译及相关科学问题,内容涉及中文句子主干成分自动识别、基于主干成分的句法统计机器翻译建模、基于主干成分的句法统计机器翻译模型训练和解码等内容。本课题将以数据驱动的方法为指导,结合人们在翻译过程中形成的先验知识构建整个机器翻译框架。课题的选题及实施依托于申请人所在团队(东北大学自然语言处理实验室)在机器翻译方面研究的多年积累,课题的研究成果将全部集成到开源统计机器翻译系统NiuTrans中,无偿为学术界共享使用。

结项摘要

机器翻译是人工智能及自然语言处理领域的重要基础研究方向之一。现在机器翻译方法大多不考虑源语言结构信息,特别是源语言的句子主干信息在机器翻译建模中没有得到考虑。因此如何利用(源语言)句子的结构信息及句子主干信息来提高机器翻译的翻译品质仍是十分重要且有待研究的科学问题。本项目从基于句子主干的翻译建模、解码及模型训练方面开展了深入研究,研究内容包括:1)在翻译建模方面,研究了基于句子主干(或骨架)的的机器翻译模型,以及将该模型在基于短语和基于句法的模型中的集成方法;2)在解码方面,研究了树到串句法翻译规则在层次短语中的有效集成方法;3)在模型训练方面,研究了基于损失函数强化的句法机器翻译模型训练框架;4)在机器翻译和语言分析支撑平台构建方面,研发了NiuParser系统并升级了NiuTrans开源统计机器翻译系统。本项目的研究成果包括8篇高水平论文(其中5篇领域顶级会议及期刊论文,如AAAI、TASLP等),培养了1名博士研究生及5名硕士研究生,并标注了中文主干成分语料库。本项目的研究成果集成在NiuTrans开源系统中。NiuTrans系统于2016获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(1)
会议论文数量(5)
专利数量(0)
基于树到串模型强化的层次短语机器翻译解码方法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    肖桐;朱靖波
  • 通讯作者:
    朱靖波
统计机器翻译删词问题研究
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    何燕龙;栾爽;肖桐;朱靖波
  • 通讯作者:
    朱靖波

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

面向语言模型的神经元连接自动学习方法
  • DOI:
    10.6043/j.issn.0438-0479.201811032
  • 发表时间:
    2019
  • 期刊:
    厦门大学学报. 自然科学版
  • 影响因子:
    --
  • 作者:
    姜雨帆;李北;林野;李垠桥;肖桐;朱靖波
  • 通讯作者:
    朱靖波
基于线状特征增强的TM遥感影像细小河流提取方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    测绘学报
  • 影响因子:
    --
  • 作者:
    姜浩;冯敏;肖桐;王昌佐
  • 通讯作者:
    王昌佐
3种提取方法对郁金散有效成分提取效果的比较
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    动物医学进展
  • 影响因子:
    --
  • 作者:
    薛姣;文艳巧;董嘉琪;张旺东;张亚辉;肖桐;曹玉霞;姚万玲;魏彦明
  • 通讯作者:
    魏彦明
三江源地区基于净初级生产力的草地生态系统脆弱性特征
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    资源科学
  • 影响因子:
    --
  • 作者:
    陈卓奇;王军邦;肖桐
  • 通讯作者:
    肖桐
中国沿海不透水地表变化特征分析
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    资源科学
  • 影响因子:
    --
  • 作者:
    翟俊;肖桐;杨旻;孙晨曦
  • 通讯作者:
    孙晨曦

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

肖桐的其他基金

面向序列生成的高效神经网络模型与方法
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
面向序列生成的高效神经网络模型与方法
  • 批准号:
    62276056
  • 批准年份:
    2022
  • 资助金额:
    56.00 万元
  • 项目类别:
    面上项目
面向神经机器翻译的结构学习方法研究
  • 批准号:
    61876035
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
基于深度句法的统计机器翻译方法研究
  • 批准号:
    61672138
  • 批准年份:
    2016
  • 资助金额:
    16.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码