Digital text archiving for cursive writing documents by using the reading voice of which the experts read aloud.

通过专家朗读的朗读声音,对草书文档进行数字文本归档。

基本信息

  • 批准号:
    21K18372
  • 负责人:
  • 金额:
    $ 2.91万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-07-09 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究は、翻刻能力を持ちながらキーボードを使ったテキストデータ化を不得意とする解読者が、オンラインデータベース上で閲覧できる古典籍を直接読み上げることで、音声認識システムを通して簡単にテキストデータ化できるシステムの構築を目指している。昨年度の成果を承け、①形態論情報付き古文テキストの作成を実施した。本研究では、江戸期の古典籍・古文書を対象とした音声認識システム構築を中心的な課題としており、研究代表者らの専門に近い、とくに歌舞伎役者を批評した芸評書である役者評判記を対象に、形態論情報付きテキストデータの作成を試みた。②音声認識システムの主要構成要素である言語モデルは江戸時代語のモデルを構築する必要があり、国立国語研究所言語資源開発センターが公開する日本語歴史コーパス 江戸時代編のデータを用いて、古文用統計的言語モデル(単語N-gram)を構築した。江戸時代語を対象に今回構築したモデルと現代日本語コーパスで学習された言語モデルの認識性能をテストしたところ、現代日本語コーパスで学習された言語モデルよりも、現時点で構築した古文用言語モデルの方が良い認識結果を示しており、本モデルの有用性が確認できた。③この成果をもとに、立命館大学アート・リサーチセンターのくずし字解読支援システムへの実装を試みたが、音声認識によるテキスト入力システムと、従来の翻刻支援システムの根幹となる縦書入力システムとの相違、単体での音声認識結果と、オンライン上のシステムでの認識結果に大きな齟齬があり、これが今年度中には解決できなかったため、実際の音声認識入力実験については、次年度に持ち越しとなった。
这项研究是一个系统,可以让具有转录能力但不擅长使用键盘将文本转换为文本数据的破译者直接阅读可以在在线数据库上查看的经典作品,并使用语音轻松将其转换为文本数据我们的目标是建立一个。基于去年的成果,我们创建了(1)带有词法信息的经典文本;本研究的主题是针对江户时代的经典书籍和文献的语音识别系统的构建,本研究的主要课题是构建针对江户时代的经典书籍和文献的语音识别系统。我们尝试创建具有文本形态信息的文本数据。 ②语言模型是语音识别系统的主要组成部分,需要针对江户时期的语言构建统计语言模型(单词N-gram)。当我们测试我们这次构建的模型针对江户时代语言和用现代日语语料库训练的语言模型的识别性能时,我们发现我们迄今为止构建的古典日语的语言模型比语言模型要好用现代日语语料库训练的模型显示出更好的识别结果,证实了该模型的有用性。 ③ 基于这一结果,我们尝试将其应用到立命馆大学艺术研究中心的九字寺破译支持系统中,但很难使用基于语音识别的文本输入系统和垂直书写输入系统,而这是该系统的基础。传统转录支持系统的单机语音识别结果与在线系统的识别结果存在较大差异,由于该问题无法在本财年内解决,因此实际的语音识别输入实验将推迟到下一财年。财政年度变成了。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
日本古典籍デジタル研究所:古典籍翻刻プロジェクト
日本经典书籍数字研究所:经典书籍复制项目
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
古文用音声認識システムの構築とくずし字翻刻の音声入力システム
构建古代日语文本语音识别系统和葛字转录语音输入系统
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhang Yutao;西浦敬信;戸塚史織;赤間亮
  • 通讯作者:
    赤間亮
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

赤間 亮其他文献

深層学習モデルに基づく浮世絵画像検索システムの開発
基于深度学习模型的浮世绘图像检索系统开发
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    王 嘉韻;Batjargal Biligsaikhan;前田 亮;川越 恭二;赤間 亮
  • 通讯作者:
    赤間 亮
芸術文化資源デジタル・アーカイブの国際的共同利用(趣旨説明) -オンライン環境での知的生産システムとそのツール
国际艺术文化资源数字档案的联合使用(目的说明)——在线环境下的智力生产系统及其工具
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    赤間 亮
  • 通讯作者:
    赤間 亮
専門分野別研究資源ポータルデータベースと相互リンクによるユーザビリティ
专业研究资源门户数据库和相互链接的可用性
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    赤間 亮
  • 通讯作者:
    赤間 亮
古典籍デジタル・アーカイブと複製出版事業の行方
经典数字档案和复制出版业务的未来
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    赤間 亮
  • 通讯作者:
    赤間 亮
立命館ARCの海外デジタルアーカイブ、その現状報告と持続可能なデジタルアーカイブへの挑戦
立命馆ARC的海外数字档案、现状报告以及创建可持续数字档案的挑战
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    赤間 亮
  • 通讯作者:
    赤間 亮

赤間 亮的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('赤間 亮', 18)}}的其他基金

Cataloging for the illustrated Japanese old books and Ukiyo-e by using ARC's Image database and producing the research basis.
利用ARC图像数据库对日本古书插图和浮世绘进行编目,并提供研究依据。
  • 批准号:
    18H00648
  • 财政年份:
    2018
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
歌舞伎上演資料の情報統合化による歌舞伎年表編纂の研究
通过歌舞伎演出资料信息整合编制歌舞伎年表的研究
  • 批准号:
    08710299
  • 财政年份:
    1996
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
辻番付による歌舞伎上演・興行史の研究
歌舞伎表演史及辻万助表演研究
  • 批准号:
    05710265
  • 财政年份:
    1993
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
芝居絵の歌舞伎研究における資料的位置づけをめぐる研究
柴家在歌舞伎研究中的作用研究
  • 批准号:
    04710228
  • 财政年份:
    1992
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

英文読解力と語彙力向上のためのRWL(音声を伴う多読)導入の効果と適正時期の検証
验证引入RWL(音频泛读)提高英语阅读理解和词汇量的有效性和适当时机
  • 批准号:
    22K00798
  • 财政年份:
    2022
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
グローバル人材の会話力を短時間で評価する対話型スピーキングテストシステムの開発
开发快速评估全球人力资源会话能力的交互式口语测试系统
  • 批准号:
    21K00668
  • 财政年份:
    2021
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Kinesthesia Detection and Feedback Platform for Motor Learning Using Voice-based ESM
使用基于语音的 ESM 进行运动学习的动觉检测和反馈平台
  • 批准号:
    20K19840
  • 财政年份:
    2020
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
正確で簡便な看護業務時間測定と評価による業務改善システムの検証と実装に向けた研究
使用准确且简单的护理工作时间测量和评估来验证和实施工作改进系统的研究
  • 批准号:
    20K19024
  • 财政年份:
    2020
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了