計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に

构建 15 世纪韩语词法语料库以进行定量分析:以佛教谚语为目标

基本信息

  • 批准号:
    20K00558
  • 负责人:
  • 金额:
    $ 1.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

計画の3年目である令和4年度にも,引き続きMeCab(めかぶ)向けの15世紀朝鮮語形態素解析用辞書である「MkHanDic」に,辞書項目の追加を行った.現在の辞書項目数は9730項目で,学習用データは3070文である.解析の精度について,やはり同音異義語の判定に問題があり,解決方法について検討を行っている.ただし,これまでの作業を通じて,辞書の項目数を着実に増やしており,さらに登録項目を増やしていくことで,全体的な精度を向上させることが可能である.引き続き,辞書項目と学習用データを増やしていく.また,形態素解析を行う前段階の作業として,TEI(Text Encoding Initiative)ガイドラインを用いた電子データの整備を並行して行っているが,今年度は『般若心経諺解』『救急簡易方諺解』の電子データ構築に着手した.これらの文献も15世紀に刊行されたものであるが,本研究で対象とする『月印釈譜』とはテキストの構造,構成がやや異なる.様々なタイプの文献について,TEIガイドラインによる電子データ化を行うことで,知見がより深まり,『月印釈譜』に対する電子データ化もさらに精緻さを加えることが可能になると考える.また,形態素解析の結果も盛り込んだ電子データ化の方法についても,今後検討する予定である.今後はこれらのデータを元に,本研究の研究対象である『月印釈譜』の他の巻についても電子データ化を行い,作業が終了したデータから形態素解析を行って,未登録の項目を辞書項目として追加する作業を行う.
在计划的第三年,我们继续将字典项目添加到“ Mkhandic”(Mkhandic),这是MeCab 15世纪韩国语音分析的词典。目前的字典项目数为9,730,培训数据为3,070个句子。关于分析的准确性,确定异义词仍然存在问题,我们正在考虑解决方案。但是,通过先前的工作,字典中的项目数量一直在稳步增加,并且通过增加注册项目的数量,可以提高整体准确性。我们将继续增加字典项目和学习数据。此外,作为形态学分析的阶段前任务,我们一直在使用TEI(文本编码计划)指南来开发电子数据的开发,但是今年我们已经开始为“ Heart Sutra Proverbs”和“紧急简单谚语”构建电子数据。这些文档也在15世纪发表,但文本的结构和结构与本研究的“月球条目”略有不同。通过使用TEI指南对各种类型的文献进行数字转换,我们将加深我们的知识,并能够进一步完善“月球雕刻得分”的数字化转换。此外,我们计划考虑一种用于数字数据转换的方法,其中包括形态分析的结果。从现在开始,基于这些数据,这是本研究主题的“月球条目”的其他卷将转换为数字数据,并且将从完成工作的数据中进行词素分析,并将未注册的项目添加为字典项目。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―
尝试对中古朝鲜语进行定量分析:使用聚类分析对《Shafu Shosettsu》各卷进行分类。
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木下瞳;林炫情;須賀井義教;斉藤信浩・林炫情・淺尾仁彦・李在鎬・須賀井義教;李在鎬;李在鎬;Yoshihiko Asao;水野淳太・淺尾仁彦;須賀井 義教
  • 通讯作者:
    須賀井 義教
中期朝鮮語の計量的分析の試み
中朝鲜语定量分析的尝试
MeCab用形態素解析辞書MkHanDic
MeCab 的形态分析词典 MkHanDic
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

須賀井 義教其他文献

誤謬推論とUnconditional Presupposition
谬误推理与无条件预设
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹;山森良枝
  • 通讯作者:
    山森良枝
韓国語文章リーダビリティ判定システム「kReadability」
韩文文本可读性判断系统“kReadability”
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩
  • 通讯作者:
    斉藤 信浩
ICT を利用した読解授業について
关于利用ICT的阅读理解课程
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩;李 在鎬;李在鎬
  • 通讯作者:
    李在鎬
目的語関係節とwhen従属節が同じであることについて-ニョロ語からの考察-
关于宾语关系从句和从属从句相同的事实 - 来自 Nyoro 语言的考虑 -
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹
  • 通讯作者:
    梶 茂樹
Interpretation of the antecedent for the English pro-form one
英语原式一的先行词解释
  • DOI:
    10.57300/cac.42.1_63
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美
  • 通讯作者:
    中井延美

須賀井 義教的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Construction and application of dictionaries for morphological analysis of Japanese dialects
日语方言词形分析词典的构建及应用
  • 批准号:
    23H00007
  • 财政年份:
    2023
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
日本語諸方言コーパスによる方言音調の比較類型論的研究
使用各种日语方言语料库进行方言声调的比较类型学研究
  • 批准号:
    21H04351
  • 财政年份:
    2021
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
「ダメな科学ライティング」をさせないための高大接続による探究学習教育法の研究
连接高中和大学的探究学习教学法研究防止“糟糕的科学写作”
  • 批准号:
    20K03251
  • 财政年份:
    2020
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Cross-sectional Study of the Texts of the Various Texts of "The Tale of Saigyo
《西行物语》各文本的横断面研究
  • 批准号:
    19K00337
  • 财政年份:
    2019
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Construction of a large word database with accent information
构建带有口音信息的大型单词数据库
  • 批准号:
    19K13173
  • 财政年份:
    2019
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了