データ合成と深層学習を用いた歴史的文書の画像解析手法 ー行抽出と行の順序付けー
利用数据合成和深度学习的历史文献图像分析方法-行提取和行排序-
基本信息
- 批准号:22K12736
- 负责人:
- 金额:$ 1万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
計算機による歴史的文書(古典籍、古文書など)の翻刻支援の研究では、文書画像中の文字の位置検出と文字のパターン認識とについての研究は進んでいる。しかし検出した各文字の読み順の決定法についてはあまり進んでいない。文字の位置検出に加えて、行の抽出と抽出した行の読み順の決定(順序付)ができれば、検出した文字の読み順が決定できると考えられる。このような背景から本研究は次の2つを目的とする。(1)古典籍を対象とした文書画像解析(行抽出、行の順序付)に利用する深層ニューラルネットワークの構成を提案し、その評価を行うこと。(2)深層ニューラルネットワークのための学習データの合成法を提案し、その評価を行うこと。2022年度の進捗は次の通りである。まず研究課題を遂行するための計算機環境の準備(ハードウェアの調達とソフトウェアのインストール)を行った。次に若干のソフトウェア開発を行った。具体的には、研究代表者らが過去に実装した注釈付き文書画像合成システムを修正した。これによって、対象とする古典籍に類似した文書画像とそのメタデータ(行の中心線画像)とを大量に合成できるようになった。さらに、そのシステムで合成した文書画像と行の中心線画像とを用い、行抽出のためのセマンティックセグメンテーションの予備的な実験を行った。本研究課題に関連する情報を収集するために、いくつかの研究集会に参加した。残念ながら研究成果の発表には至らなかった。
在基于计算机的历史文献(典籍、古代文献等)转录支持研究中,文档图像中的字符位置检测和字符模式识别方面的研究正在取得进展。然而,在确定每个检测到的字符的读取顺序方面进展甚微。除了检测字符的位置之外,如果可以提取行并且可以确定(排序)提取的行的读取顺序,则可以确定检测到的字符的读取顺序。在此背景下,本研究有以下两个目的。 (1) 提出并评估用于经典书籍文档图像分析(行提取、行排序)的深度神经网络的配置。 (2)提出并评估一种合成深度神经网络训练数据的方法。 2022财年的进展如下。首先,我们准备计算机环境(采购硬件和安装软件)来开展研究项目。接下来,我做了一些软件开发。具体来说,研究人员修改了他们过去实施的带注释的文档图像合成系统。这使得合成大量类似于目标经典书籍及其元数据(线中心线图像)的文档图像成为可能。此外,我们利用系统合成的文档图像和线中心线图像进行了用于线提取的语义分割的初步实验。我参加了几次研究会议来收集与该研究主题相关的信息。遗憾的是,研究结果并未发表。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鈴木 徹也其他文献
高濃度水素水によるゲフィチニブの急性肺傷害抑制
高浓度氢水抑制吉非替尼引起的急性肺损伤
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
寺崎 泰弘 ;大澤 郁朗;鈴木 徹也;渡名喜 梢;漆山 博和;寺崎 美佳;功刀 しのぶ;福田 悠;清水 章 - 通讯作者:
清水 章
鈴木 徹也的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鈴木 徹也', 18)}}的其他基金
位置指向検索向けメタデータ作成ソフトウェアに関する研究
面向位置搜索的元数据创建软件研究
- 批准号:
18700035 - 财政年份:2006
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
コンピュータを利用した媒介変数による関数概念の形成について
利用计算机使用参数变量形成函数概念
- 批准号:
03913003 - 财政年份:1991
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
相似海外基金
文禄・慶長の役(1592-1598)に関するヨーロッパ文書の文献言語学的・歴史学的研究
与文禄和庆长时代(1592-1598)相关的欧洲文献的语言和历史研究
- 批准号:
23K25352 - 财政年份:2024
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Historical reconstruction of epidemiological situation in East Asia base on the documents of the Ministry of Health in United Kingdom
基于英国卫生部文件的东亚流行病学形势历史重建
- 批准号:
23K17522 - 财政年份:2023
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
文禄・慶長の役(1592-1598)に関するヨーロッパ文書の文献言語学的・歴史学的研究
与文禄和庆长时代(1592-1598)相关的欧洲文献的语言和历史研究
- 批准号:
23H00655 - 财政年份:2023
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Possibilities of Digital Twin for Creating New Immersive and Appreciative Landscapes from Historical Documents of Early Modern Japan
数字孪生从早期现代日本的历史文献中创造新的沉浸式和欣赏性景观的可能性
- 批准号:
23K11753 - 财政年份:2023
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
"Collective Memory" and "Scribal Culture" in the Formation of Deuteronomistic History
申命记历史形成中的“集体记忆”与“抄写文化”
- 批准号:
22K00080 - 财政年份:2022
- 资助金额:
$ 1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)