計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に
构建 15 世纪韩语词法语料库以进行定量分析:以佛教谚语为目标
基本信息
- 批准号:20K00558
- 负责人:
- 金额:$ 1.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
計画の3年目である令和4年度にも,引き続きMeCab(めかぶ)向けの15世紀朝鮮語形態素解析用辞書である「MkHanDic」に,辞書項目の追加を行った.現在の辞書項目数は9730項目で,学習用データは3070文である.解析の精度について,やはり同音異義語の判定に問題があり,解決方法について検討を行っている.ただし,これまでの作業を通じて,辞書の項目数を着実に増やしており,さらに登録項目を増やしていくことで,全体的な精度を向上させることが可能である.引き続き,辞書項目と学習用データを増やしていく.また,形態素解析を行う前段階の作業として,TEI(Text Encoding Initiative)ガイドラインを用いた電子データの整備を並行して行っているが,今年度は『般若心経諺解』『救急簡易方諺解』の電子データ構築に着手した.これらの文献も15世紀に刊行されたものであるが,本研究で対象とする『月印釈譜』とはテキストの構造,構成がやや異なる.様々なタイプの文献について,TEIガイドラインによる電子データ化を行うことで,知見がより深まり,『月印釈譜』に対する電子データ化もさらに精緻さを加えることが可能になると考える.また,形態素解析の結果も盛り込んだ電子データ化の方法についても,今後検討する予定である.今後はこれらのデータを元に,本研究の研究対象である『月印釈譜』の他の巻についても電子データ化を行い,作業が終了したデータから形態素解析を行って,未登録の項目を辞書項目として追加する作業を行う.
在计划的第三年,我们继续将字典项目添加到“ Mkhandic”(Mkhandic),这是MeCab 15世纪韩国语音分析的词典。目前的字典项目数为9,730,培训数据为3,070个句子。关于分析的准确性,确定异义词仍然存在问题,我们正在考虑解决方案。但是,通过先前的工作,字典中的项目数量一直在稳步增加,并且通过增加注册项目的数量,可以提高整体准确性。我们将继续增加字典项目和学习数据。此外,作为形态学分析的阶段前任务,我们一直在使用TEI(文本编码计划)指南来开发电子数据的开发,但是今年我们已经开始为“ Heart Sutra Proverbs”和“紧急简单谚语”构建电子数据。这些文档也在15世纪发表,但文本的结构和结构与本研究的“月球条目”略有不同。通过使用TEI指南对各种类型的文献进行数字转换,我们将加深我们的知识,并能够进一步完善“月球雕刻得分”的数字化转换。此外,我们计划考虑一种用于数字数据转换的方法,其中包括形态分析的结果。从现在开始,基于这些数据,这是本研究主题的“月球条目”的其他卷将转换为数字数据,并且将从完成工作的数据中进行词素分析,并将未注册的项目添加为字典项目。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―
尝试对中古朝鲜语进行定量分析:使用聚类分析对《Shafu Shosettsu》各卷进行分类。
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:木下瞳;林炫情;須賀井義教;斉藤信浩・林炫情・淺尾仁彦・李在鎬・須賀井義教;李在鎬;李在鎬;Yoshihiko Asao;水野淳太・淺尾仁彦;須賀井 義教
- 通讯作者:須賀井 義教
中期朝鮮語の計量的分析の試み
中朝鲜语定量分析的尝试
- DOI:10.50986/koreanlinguistics.9.0_175
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教
- 通讯作者:須賀井 義教
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
須賀井 義教其他文献
誤謬推論とUnconditional Presupposition
谬误推理与无条件预设
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹;山森良枝 - 通讯作者:
山森良枝
韓国語文章リーダビリティ判定システム「kReadability」
韩文文本可读性判断系统“kReadability”
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩 - 通讯作者:
斉藤 信浩
ICT を利用した読解授業について
关于利用ICT的阅读理解课程
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩;李 在鎬;李在鎬 - 通讯作者:
李在鎬
目的語関係節とwhen従属節が同じであることについて-ニョロ語からの考察-
关于宾语关系从句和从属从句相同的事实 - 来自 Nyoro 语言的考虑 -
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹 - 通讯作者:
梶 茂樹
Interpretation of the antecedent for the English pro-form one
英语原式一的先行词解释
- DOI:
10.57300/cac.42.1_63 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美 - 通讯作者:
中井延美
須賀井 義教的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Construction and application of dictionaries for morphological analysis of Japanese dialects
日语方言词形分析词典的构建及应用
- 批准号:
23H00007 - 财政年份:2023
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
日本語諸方言コーパスによる方言音調の比較類型論的研究
使用各种日语方言语料库进行方言声调的比较类型学研究
- 批准号:
21H04351 - 财政年份:2021
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
「ダメな科学ライティング」をさせないための高大接続による探究学習教育法の研究
连接高中和大学的探究学习教学法研究防止“糟糕的科学写作”
- 批准号:
20K03251 - 财政年份:2020
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Cross-sectional Study of the Texts of the Various Texts of "The Tale of Saigyo
《西行物语》各文本的横断面研究
- 批准号:
19K00337 - 财政年份:2019
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Construction of a large word database with accent information
构建带有口音信息的大型单词数据库
- 批准号:
19K13173 - 财政年份:2019
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Early-Career Scientists