Development of a Support System for the Reprinting of Oieryu Kuzushiji (Edo Period Official Handwriting) Documents by Integrating Visual and Linguistic Information
通过整合视觉和语言信息开发重印江户时代官方手写文献的支持系统
基本信息
- 批准号:22K18149
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
この研究では、御家流と呼ばれる江戸期の公的な文書などに使用する書体で書かれた日記(業務文書)の翻刻を支援するシステムを開発する。最近は、IIIFという標準規格に基づいた歴史文化系画像が公開されており、これらの画像を使った人文学研究のためのAI-OCR(光学文字認識)技術で自動翻刻が試みられている。例えば、現行のAI-OCRアプリ「miwo」は、AI-OCR技術によりくずし字で書かれた文書などの画像を読み取り、楷書体の文字に翻刻するアプリの中でも実用的なものだが、漢字が95%以上を占める江戸期の日記に対しては、文字位置の判定は高精度に行う一方で、文字の判定は10%~50%程度に留まる。これは、AI-OCRに用いる学習データの量と種類が不足しているためである。現在利用可能なくずし字データは、人文学オープンデータ共同利用センター(CODH)から配布されているものがあるが、これらのデータは主に文学作品で変体仮名の多用される古典籍画像から、専門家によって手作業でアノテーションされたものである。他方、くずし字の解読がある程度の訓練を要するものである以上、不特定多数によるクラウドソーシングのような方法は品質保証が難しく非現実的である。しかし、最終的には専門家によるデータの確認も必要である。このような状況下でくずし字用のAI-OCRの質を高めるには、人と技術をうまく活用する手法を確立することで、多様な文書に用いられていた御家流くずし字字形の学習データを増やす仕組みを確立することが重要となる。今年度は、くずし字の読み解きに興味のある市民と希少な専門家の技術を効率的に生かす翻刻支援システムにより正解データを増やせる環境を構築した。専用作業サイトを実装して2名に実際にサイトを利用して御家流くずし字のアノテーションデータを修正し、正解データに仕上げることが可能になった。
这项研究将开发一个系统,该系统支持重印日记(业务文件),用江户时代的官方文档中使用的字体(称为Gokei风格)。最近,已经发布了基于IIIF标准的历史和文化图像,并使用这些图像使用AI-OR(光学特征识别)技术来尝试使用AI-OR(光学特征识别)技术进行自动重印。例如,当前的AI-OCR应用程序“ Miwo”是一个实用的应用程序,它使用AI-OR技术来读取用Kuzushiji编写的文档的图像并将其转载为常规字体字符。但是,对于江户时期日记的日记,汉字占汉字的95%以上,角色位置的精度很高,而角色判断仅约10%至50%。这是因为缺乏AI-OR中使用的培训数据的数量和类型。一些当前可用的Sushi-Chat数据数据是由人文开放数据联合使用中心(CODH)分发的,但是这些数据主要是由经常在文学作品中经常使用的古典书籍图像的专家注释,并且经常用于变态的卡纳斯。另一方面,由于解码kuzushi字符需要一定程度的培训,因此诸如未指定人数的众包等方法难以确保质量。但是,最终,还必须检查专家的数据。为了在这种情况下提高AI-OR质量的Kuzushi-JI质量,建立一个系统将增加Kuzushi-Ji-JI风格的学习数据,这将非常重要,该系统已通过建立充分利用人员和技术的方法来在各种文档中使用。今年,我们创造了一个环境,可以使用重印支持系统可以有效利用有兴趣解释Kuzushi角色和稀有专家的公民的技能来增加正确的数据。已经实施了一个专用的工作网站,两个人实际上可以使用该网站来修改Goya Style Kuzushi字符的注释数据,并将其作为正确的数据。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
[A4] Construction of a Database Aimed at Complementing Information by Presenting Time Series of Scattered Regional Business Records in the Edo period
[A4]通过呈现江户时代分散的地区商业记录的时间序列来构建旨在补充信息的数据库
- DOI:10.24506/jsda.6.s3_s131
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:吉賀 夏子;伊藤 昭弘
- 通讯作者:伊藤 昭弘
多様なくずし字画像に対応するアノテーションデータセット収集システムの試作
支持多种葛藤图像的注释数据集收集系统的原型制作
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:吉賀 夏子;橋本 雄太
- 通讯作者:橋本 雄太
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
吉賀 夏子其他文献
GlyphWikiによる観智院本『類聚名義抄』字形の再現とその改善
GlyphWiki 再现并改进了 Kanchiin 书籍“Ruiju Meigisho”的字符形状
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;池田証壽・李媛・劉冠偉・鄭門鎬 - 通讯作者:
池田証壽・李媛・劉冠偉・鄭門鎬
南宋・陸四郎筆 羅漢図(藤田美術館蔵)
南宋 陆四郎罗汉图(藤田美术馆藏)
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;稲場圭信;村上祐子;北澤菜月 - 通讯作者:
北澤菜月
ja The Japan Architect 危機がデザイン する都市
zh 日本建筑师 一座由危机设计的城市
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
王庭輝;岸田拓也;中鹿亘;Ichiro Inoue;水沼友宏;吉賀 夏子;福岡孝則 - 通讯作者:
福岡孝則
五代・北宋期における熾盛光道場本尊図像の形成と伝播―温州白象塔星宿神塑像をめぐって―
五朝北宋青神岗道场主要形象的形成与传播——以温州白象塔、星神塑像为例
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;稲場圭信;村上祐子;北澤菜月;稲場圭信;大谷卓史;谷口耕生 - 通讯作者:
谷口耕生
吉賀 夏子的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:62203444
- 批准年份:2022
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
TRUST2 - Improving TRUST in artificial intelligence and machine learning for critical building management
TRUST2 - 提高关键建筑管理的人工智能和机器学习的信任度
- 批准号:
10093095 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
Collaborative R&D
6G Goal-Oriented AI-enabled Learning and Semantic Communication Networks (6G Goals)
6G目标导向的人工智能学习和语义通信网络(6G目标)
- 批准号:
10110118 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
EU-Funded
Quantum Machine Learning for Financial Data Streams
金融数据流的量子机器学习
- 批准号:
10073285 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
Feasibility Studies
Explainable machine learning for electrification of everything
可解释的机器学习,实现万物电气化
- 批准号:
LP230100439 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
Linkage Projects
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
- 批准号:
DP240103278 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Projects