形態素の複合化処理による中日機械翻訳に関する研究

基于词素复合处理的汉日机器翻译研究

基本信息

  • 批准号:
    04680021
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1992
  • 资助国家:
    日本
  • 起止时间:
    1992 至 无数据
  • 项目状态:
    已结题

项目摘要

現在一般的な機械翻訳手法は、原言語文の形態素解析、構文解析を行って文を構文要素に分解し、それを目的言語の構文要素に変換してから各要素及び要素間の意味解析を行って翻訳結果を得るという形態が多い。しかしながら、漢字べた書きで表記され、かつ日本語の助詞のような格マーカーを持たない中国語文では、形態素ならびに構文の意味依存性が大きく、また多品詞語、多義語が多いために上のように各解析段階を分離する手法は適していない。本研究では、このような性質を持つ中国語文の形態素解析を効率的に行うために、隣接する単語間の意味属性を利用して可能な場合は隣接語をあらかじめ複合化することにより、多品詞語、多義語に起因するあいまいさを解消する手法の研究を行った。本研究により得られた成果の概要を以下に示す。1.中国語の教科書及び科学技術文献49編(1,862文)を調査し,基本的な中国語文における隣接語間の複合化規則25個を抽出した。また、これらの複合化規則を適用する際の優先順位を求め、4段階の順位があることを見出した。2.これらの複合化規則及び優先順位と、特別な形式を持つ三向動詞、ならびに動詞、名詞のいずれにもなりうる兼用品詞を含む場合の処理規則を組み合わせ、隣接語からの複合語生成アルゴリズムを構成した。3.このアルゴリズムに基づく複合語生成実験システムを構築した。4.日本語教育用の教科書,科学技術文献などから選んだ400文(15,598字)について複合語の生成実験を行った結果,複合語になるべき語、総数437語のうち415語が正しく生成され,本アルゴリズムが良好な性能をもつことが確認された。
当今最常见的机器翻译方法涉及对原始语言句子的形态分析和句法分析,将句子分解为句法元素,将其转换为目标语言的句法元素,然后将每个元素与元素之间的语义分析转换为以获得翻译结果。但是,用中国句子以汉字填充的方式编写的句子,没有像日本粒子这样的案例标记,词素和语法的语义依赖性很大,并且有许多多派对语音和polysone单词,因此将每个分析阶段分开的方法不合适。在这项研究中,为了在具有这种性质的中国句子中有效地分析形态学,我们研究了一种消除由多部分的言论和多部分单词引起的歧义的方法,该方法是通过使用相邻单词之间的语义属性以及在可能的情况下使用邻近单词之间的语义属性。从这项研究获得的结果如下概述。 1。我们研究了49本中文教科书,科学技术文献(1,862个句子),并在基本的中文句子中提取了25种复合规则。此外,我们在应用这些复合规则时确定了优先级,并发现有四个排名。 2。这些复合规则和优先级与处理规则相结合,包括具有特殊形式的三重奏和可以是动词或名词的暨产物单词,以形成来自相邻单词的复合单词生成算法。 3。我们基于此算法构建了一个复合单词生成实验系统。 4。我们对从日语教育,科学和技术文献的教科书中选择的400个句子(15,598个字符)进行了实验,发现应正确生成应该复合单词的总数中的415个单词,并且该算法具有良好的性能。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
金 紅蘭、宮永 喜一、栃内 香次: "韓中機械翻訳における韓国語格助詞の処理" 1993年電子情報通信学会春季大会講演論文集. 6-123- (1993)
Hongran Kim、Kiichi Miyanaga、Koji Tochinai:“韩语-中文机器翻译中韩语格词的处理”1993 年 IEICE 春季会议记录 6-123- (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
范 莉馨、任 福継、宮永 喜一、栃内 香次: "機械翻訳における中国語の離合詞について" 1993年電子情報通信学会春季大会講演論文集. 6-122- (1993)
Rika Fan、Fukutsugu Ni、Kiichi Miyanaga、Koji Tochinai:“关于机器翻译中的中文析取”1993 年 IEICE 春季会议记录 6-122- (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
范 莉馨、任 福継、宮永 喜一、栃内 香次: "中日機械翻訳における中国語複合語の自動合成について" 情報処理学会論文誌. 33. 1103-1113 (1992)
Rika Fan、Fukutsugu Ni、Kiichi Miyanaga、Koji Tochinai:“关于中日机器翻译中中文复合词的自动合成”,日本信息处理学会会刊 33. 1103-1113 (1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
金 紅蘭、宮永 喜一、栃内 香次: "日中機械翻訳における複合語処理" 平成4年電気関係学会北海道支部連合大会講演論文集. 422- (1992)
Hongran Kim、Kiichi Miyanaga、Koji Tochinai:“日汉机器翻译中的复合字处理”电气工程学会 1992 年北海道分会会议记录 422-(1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
范 莉馨、任 福継、宮永 喜一、栃内 香次: "文の構造特徴を利用した中日機械翻訳システム(中国語)" 中国学協協会青年学術会議論文集. 232-237 (1992)
Rika Fan、Futsugu Ren、Kiichi Miyanaga、Koji Tochinai:“一种利用句子结构特征的中日机器翻译系统(中文)”中国学会青年学术会议论文集232-237(1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

栃内 香次其他文献

栃内 香次的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('栃内 香次', 18)}}的其他基金

単語接続情報を利用した英日機械翻訳に関する研究
利用词连接信息的英日机器翻译研究
  • 批准号:
    01580017
  • 财政年份:
    1989
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
誤りの多い文字列からの原文復元に関する研究
错误字符串恢复原文的研究
  • 批准号:
    63580017
  • 财政年份:
    1988
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
キーワード抽出方式によるべた書き文のかな漢字変換に関する研究
基于关键词提取方法的实体文本假名汉字转换研究
  • 批准号:
    60580015
  • 财政年份:
    1985
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Structurized Term Extraction from Academic Text Corpora
学术文本语料库中的结构化术语提取
  • 批准号:
    19500135
  • 财政年份:
    2007
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research and Development of Multi-lingual Lexical Analysis System based on Word Construction
基于构词法的多语言词法分析系统的研究与开发
  • 批准号:
    18300051
  • 财政年份:
    2006
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CTN: Harvard University Northern New England Node
CTN:哈佛大学北新英格兰节点
  • 批准号:
    7384300
  • 财政年份:
    2002
  • 资助金额:
    $ 1.15万
  • 项目类别:
CTN: Harvard University Northern New England Node
CTN:哈佛大学北新英格兰节点
  • 批准号:
    7437556
  • 财政年份:
    2002
  • 资助金额:
    $ 1.15万
  • 项目类别:
n個の名詞が連接した日本語複合名詞の解析
由n个名词连接组成的日语复合名词分析
  • 批准号:
    09780348
  • 财政年份:
    1997
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了