大規模な言語リソースを用いた自然言語処理による学習支援システムの開発

利用大规模语言资源开发利用自然语言处理的学习支持系统

基本信息

  • 批准号:
    13J10023
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2013
  • 资助国家:
    日本
  • 起止时间:
    2013-04-01 至 2015-03-31
  • 项目状态:
    已结题

项目摘要

本研究の目的は、大規模な言語リソース用いた誤り訂正およびそれを用いた日本語学習支援システムの開発である。本研究で用いる手法で捉えられる学習者の誤りを明らかにし、また実際に日本語学習支援システムを学習者に使用してもらうことで、提案する手法を用いたシステムの学習効果を明らかにすることである。本研究で行うことは大きく分けて以下の3つであった。(1) 係り受け、構文情報を用いた統計的機械翻訳による誤り訂正と誤り訂正ルールの獲得、(2) 母語による誤り傾向の獲得、(3) 日本語学習支援システムの開発本年度の実施した範囲では、実際に日本語学習支援システムの開発を行ない、学習効果を明らかにするまでは至らなかった。昨年度の研究で係り受け、構文情報を考慮した統計的機械翻訳を使った文法誤り訂正の手法で訂正結果が良くならないことが判明した。本年度は、機械翻訳を使った文法誤り訂正システムが複数の訂正結果を出力できることに着眼した。複数の訂正結果の中を見ると、1つだけ訂正を出力した場合よりも良い訂正が含まれていた。そこで、この複数の訂正結果から一番良い訂正結果を選ぶ、リランキングと呼ばれる手法の構築を行なった。このリランキングの手法では先にあげた係り受け、構文情報も考慮することが可能である。昨年度同様、日本語では、学習者の書いた文に対する単語分割に失敗するという問題があるため、英語を対象として実験を行なった。その結果、係り受け、構文情報を考慮することで訂正性能が改善した。また、大規模学習者コーパスからの母語訳付き学習者コーパスの作成も行なった。本研究で用いているコーパスの中には、学習言語による作文に対して母語訳が併記されているものがある。そこで母語が併記された学習者の文を自動で抽出する手法を提案した。母語訳が付いているもの以外も抽出しているところがあるため、今後さらなる改善が必要である。
这项研究的目的是开发大型语言资源以及使用它的日语学习支持系统的发展。为了阐明本研究中使用的方法中捕获的学习者的错误,并通过让学习者使用日语学习支持系统来阐明系统的学习效果。在这项研究中,主要有以下三个。 (1)通过使用语法信息进行统计机器翻译,通过统计机器翻译获取错误的校正和错误校正规则,(2)以母语的方式获取不正确的趋势,(3)今年的日本学习支持系统的发展,那么不可能实际开发日语学习支持系统并阐明学习效果。在去年的研究中,发现校正结果并未通过使用统计机器翻译来考虑语法信息来改善语法错误的方法。今年,我们专注于这样一个事实,即使用机器翻译的语法错误校正系统可以输出多个校正结果。在多个校正结果中查看,它包含比一个更正输出更好的校正。因此,我们建立了一种称为芦苇排名的方法,该方法从此多个校正结果中选择最佳校正结果。在这种重新分类方法中,可以考虑前面提到的负责和语法信息。像去年一样,在日语中,一个问题划分到学习者的问题写了一个单词,所以我们进行了英语实验。结果,通过考虑收费和语法信息,可以提高校正性能。他还创建了Copus,这是一个从大型学习者Capus翻译的学习者。这项研究中使用的一些COPATH包含其本地翻译,以构成学习语言。因此,我们提出了一种自动提取具有母语的学习者的句子的方法。除了具有母语翻译的地方以外,还有一个被提取的地方,因此将来需要进一步改进。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
統計的機械翻訳に基づく英語文法誤り訂正におけるフレーズベースと統語ベースの比較と分析
基于统计机器翻译的基于短语和句法的英语语法纠错对比分析
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    水本智也;松本裕治
  • 通讯作者:
    松本裕治
統計的機械翻訳を用いた英語文法誤り訂正のリランキングによる性能改善
通过使用统计机器翻译重新排名来提高英语语法纠错的性能
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    水本智也;小町守;永田昌明;松本裕治;水本智也
  • 通讯作者:
    水本智也
NAIST at the NLI 2013 Shared Task
  • DOI:
  • 发表时间:
    2013-06
  • 期刊:
  • 影响因子:
    2
  • 作者:
    Tomoya Mizumoto;Yuta Hayashibe;Keisuke Sakaguchi;Mamoru Komachi;Yuji Matsumoto
  • 通讯作者:
    Tomoya Mizumoto;Yuta Hayashibe;Keisuke Sakaguchi;Mamoru Komachi;Yuji Matsumoto
学学習SNS の添削ログからの母語訳付き学習者コーパスの構築に向けて
从学术学习 SNS 的修正日志中构建母语翻译学习者语料库
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    水本智也;小町守;永田昌明;松本裕治;水本智也;水本智也
  • 通讯作者:
    水本智也
Mining Revision Log of Language Learning SNS for Automated Japanese Error Correction
挖掘语言学习SNS的修订日志以实现日语自动纠错
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

水本 智也其他文献

格構造に注目した日本語-日本語手話の並び替えと述語項構造に注目した語義曖昧性解消
注重格结构的日日手语排序和注重谓语论元结构的语义消歧
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    三澤 賢祐;酒井 啓道;吉川 友也;水本 智也;松本 裕治
  • 通讯作者:
    松本 裕治

水本 智也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('水本 智也', 18)}}的其他基金

SIRT7によるNFIL3を介した糖新生制御機構の解明
SIRT7 阐明 NFIL3 介导的糖异生控制机制
  • 批准号:
    24K19308
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
SIRT7による肝糖新生制御機構の解明
SIRT7 阐明肝脏糖异生控制机制
  • 批准号:
    23K19568
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up

相似海外基金

Construction of an Evaluation Dataset and Quality Estimation for Neural Language Generation
神经语言生成评估数据集的构建和质量评估
  • 批准号:
    22H03651
  • 财政年份:
    2022
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Examination of the effects of explicit instruction and error correction to Japanese learners of English
明确教学和纠错对日本英语学习者的效果检验
  • 批准号:
    21H00541
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
言語学習者の誤用に注目した単語と文の分散表現の獲得と分析
获取和分析单词和句子的分布式表示,重点关注语言学习者的误用
  • 批准号:
    19KK0286
  • 财政年份:
    2020
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (A))
Compositionality and Interpretation of Word Embeddings
词嵌入的组合性和解释
  • 批准号:
    19K12099
  • 财政年份:
    2019
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
学習者のライティングレベルを考慮した自動英語文法誤り訂正
自动英语语法纠错,考虑学习者的写作水平
  • 批准号:
    19J14084
  • 财政年份:
    2019
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了