自然言語処理技術を用いた快適なWeb利活用支援に関する研究

利用自然语言处理技术支持舒适网络使用的研究

基本信息

  • 批准号:
    19K12241
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2019
  • 资助国家:
    日本
  • 起止时间:
    2019-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本年度では研究計画に沿って、以下の各々のテーマで推進した。(1)前年度の用語抽出研究で得られた研究成果に基づき、小・中学生のプログラミング教育の接続支援に関する研究を展開した。本年度では、プログラミング課題を記述する文章(課題テキスト)の可読化を目指し、課題テキストとそれを遂行するためのプログラムコードの対応データの収集を行った。さらに、課題テキストに対し、入力や与えられた条件、出力などに関する記述箇所を特定する情報(タグ)を付与し、タグ付きコーパスの構築を行った。構築したコーパスの有用性を検証するために、用語抽出研究で開発したBERTのQAタスク仕様での用語抽出手法での、タグ付きコーパスを用いたファインチューニングと課題テキストのタグ付けの実験を進めている。(2)前年度の日本語学習支援に関する研究を引き続き推進した。日本語学習者への作文支援を行うための、作文中の日本語文法の誤り検出に関する研究を行った。文法誤り検出を系列ラベリングタスクとしてとらえ、BERTモデルをベースとし、日本語入力を単語分割せずにも解析できるFlairモデルの導入など、深層学習で解く手法を提案した。語学学習のための、誤りを含む文とその訂正文からなるLang-8コーパスから抽出・加工した72万文のデータを用いた実験で、提案手法の有効性を確認した。(3)そのほかに、多言語Amazonレビューテキスト中の約20万日本語レビューテキストに対し、BERTとRoBERTaのレーティング予測(星数の予測)に関する比較実験も行った。また、本科研費課題の要素技術としてテキストの段落分割の研究も行った。BERTにauxiliary lossを導入することにより、従来手法より段落分割の精度が向上したことを確認した。上記研究成果は査読付き学術雑誌論文1編と査読なし論文2編として発表した。
今年,我们按照研究计划推进了以下各个主题。 (1)在上一年术语提取研究取得的研究成果的基础上,开展了针对中小学生编程教育的连接支持研究。今年,为了使描述编程任务(作业文本)的文字变得可读,我们收集了与任务文本相对应的数据以及完成该任务的程序代码。此外,我们在任务文本中添加了信息(标签),用于标识输入、给定条件、输出等的写入位置,并构建了带标签的语料库。为了验证构建的语料库的有用性,我们使用标记语料库对基于 BERT 的 QA 任务规范的术语提取研究中开发的术语提取方法进行了微调,并对指定的文本进行了标记。 (2)继续前一年的日语学习支援研究。我们开展了检测作文中日语语法错误的研究,以便为日语学习者提供写作支持。将语法错误检测视为序列标记任务,我们提出了一种利用深度学习来解决它的方法,包括引入 Flair 模型,该模型基于 BERT 模型,无需分词即可分析日语输入。使用从 Lang-8 语料库中提取和处理的 720,000 个句子的数据进行的实验证实了该方法的有效性,这些句子由包含错误的句子及其纠正的句子组成,用于语言学习。 (3)此外,我们还对多语言亚马逊评论文本中约20万条日语评论文本进行了BERT和RoBERTa之间的评分预测(星数预测)对比实验。我们还对文本段落分割进行了研究,作为该研究项目的一项基本技术。通过向 BERT 引入辅助损失,我们证实与传统方法相比,段落划分的准确性有所提高。上述研究成果发表在一篇同行评审学术期刊论文和两篇非同行评审论文中。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
日本語レビューに対するレーティング予測の精度比較
日本评论评分预测准确率比较
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森廣勇樹; 南條浩輝; 馬青
  • 通讯作者:
    馬青
化粧品レビューテキストに基づく個人化推薦システム
基于化妆品评论文本的个性化推荐系统
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚越三蘭; 馬青; 村田真樹
  • 通讯作者:
    村田真樹
Estimation of Twitter Opinion Trends of Approval of Political Parties Using SVM and LSTM
使用 SVM 和 LSTM 估计 Twitter 上政党认可度的意见趋势
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qing Ma
  • 通讯作者:
    Qing Ma
単語制約を用いた概念ネットワークの改良
使用单词约束改进概念网络
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    本田涼太;村田真樹;馬青
  • 通讯作者:
    馬青
機械学習と統計的検定を利用した知見獲得とその評価
使用机器学习和统计测试获取知识并对其进行评估
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    董卜睿;村田真樹;馬青
  • 通讯作者:
    馬青
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

馬 青其他文献

馬 青的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Compositionality and Interpretation of Word Embeddings
词嵌入的组合性和解释
  • 批准号:
    19K12099
  • 财政年份:
    2019
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Exploring learning effect thresholds in English Writing to maximize learning effect
探索英语写作学习效果阈值,实现学习效果最大化
  • 批准号:
    26750091
  • 财政年份:
    2014
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Function word choice in Spanish learner language: error annotation, automatic detection and correction
西班牙语学习者语言中的功能词选择:错误标注、自动检测和纠正
  • 批准号:
    25770207
  • 财政年份:
    2013
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Automatic prosody evaluation and grammatical mistake detection for English learning by Japanese native speakers
日语母语者英语学习的自动韵律评估和语法错误检测
  • 批准号:
    20320075
  • 财政年份:
    2008
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a computer-assisted language learning system utilizing a speaker adaptation and a grammatical error modeling
利用说话者适应和语法错误建模开发计算机辅助语言学习系统
  • 批准号:
    16300260
  • 财政年份:
    2004
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了