Knowlaedge information analysis of Historical Document Understanding

历史文献理解的知识信息分析

基本信息

项目摘要

In this research project, we studied the following four research topics : (1) Structuring the knowledge of Historical Document Understanding, (2) Study of the Historical Chara cter Recognition using our Historical Character OCR dictionary, (3) Developing a Dictionary for Historical Character Recognition, and (4) Developing a proto-type system of a computer ized Historical Character Dictionary (1) We developed a Historical Corpus Database analyzing many loan contracts consists of 1, 300 documents and 243, 000 characters. The common and frequent expressions are extracted from the documents. By using the data, we developed a proto-type of Historical Document Analysis Supporting System using n-gram method. Through an usability test, efficiency of the interface is confirmed statistically. (2) We developed some Historical Character Recognition methods using neural network. (3) Besides the database described in (1), we made another Historical Character Database of "Kuzushi-ji Kaidoku Jiten" published from Tokyoudo Syoten, which is one of the standard dictionary. The dictionary includes 25, 000 characters. (4) We have done some basic studies and have made a proto-type system of portable electrical dictionary, which could be searched by pronunciation, shape, and stroke order.
In this research project, we studied the following four research topics : (1) Structuring the knowledge of Historical Document Understanding, (2) Study of the Historical Chara cter Recognition using our Historical Character OCR dictionary, (3) Developing a Dictionary for Historical Character Recognition, and (4) Developing a proto-type system of a computer ized Historical Character Dictionary (1) We developed a Historical Corpus Database analyzing many loan contracts consists of 1, 300 documents and 243,000个字符。从文档中提取常见和频繁的表达式。通过使用数据,我们使用N-Gram方法开发了支持系统的历史文档分析原型。通过可用性测试,统计确认了界面的效率。 (2)我们使用神经网络开发了一些历史性角色识别方法。 (3)除了(1)中描述的数据库外,我们还制作了由Tokyoudo Syoten出版的另一个历史性数据库,它是标准字典之一。字典包含25,000个字符。 (4)我们已经进行了一些基本研究,并制造了便携式电气词典的原型型系统,可以通过发音,形状和中风顺序搜索。

项目成果

期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山田奨治, 柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)
Shoji Yamada、Mamoru Shibayama:“使用 n-gram 对古代文档和文档转录的支持研究”2000 年人文与计算机研讨会论文集。185-192 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. 67. 70-79 (2001)
Mamoru Shibayama:“古代文献标题的字符识别词典的构建及其使用”京都大学大型计算机中心研讨会报告 67. 70-79 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)
Shoji Yamada 等:“关于开发古代文献转录支持系统的项目报告(1)项目概述”日本信息处理学会研究报告,2000 年,8. 1-8 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイティ大会. D-12-8. 183 (2001)
Sanae Shinohara 等人:“使用 SVM 进行手写相似字符识别的训练数据选择和识别准确性的研究”2001 IEICE 协会会议 D-12-8 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

YAMADA Shoji其他文献

YAMADA Shoji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('YAMADA Shoji', 18)}}的其他基金

Different effects of enantiomers of beta2-adrenergic agonist on muscle and bone.
β2-肾上腺素能激动剂对映体对肌肉和骨骼的不同影响。
  • 批准号:
    22592077
  • 财政年份:
    2010
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Infrastructure Development for Historical Time-spatial Data Mning to Modern Japan
近代日本历史时空数据挖掘基础设施建设
  • 批准号:
    19200019
  • 财政年份:
    2007
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of Data Mining Resources for Knowledge Discovery of Pre-Modern Japanese Concepts
开发用于前现代日本概念知识发现的数据挖掘资源
  • 批准号:
    16200018
  • 财政年份:
    2004
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Effect of VEGF's on osteockast formation and activation
VEGF 对骨细胞形成和激活的影响
  • 批准号:
    13671950
  • 财政年份:
    2001
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Developing a Historical Document Analysis System Using Hand-written OCR Techomology
使用手写 OCR 技术开发历史文档分析系统
  • 批准号:
    11558045
  • 财政年份:
    1999
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Effect of CFS-1 on osteoclast and its precursor cells
CFS-1对破骨细胞及其前体细胞的影响
  • 批准号:
    07672028
  • 财政年份:
    1995
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of repetitious mechanical stress loading system for cultured cells.
培养细胞重复机械应力加载系统的开发。
  • 批准号:
    03557078
  • 财政年份:
    1991
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
Improvement of Characteristics of Complementary Elactrochromic Devices by the Use of Various Transition-Metal-Oxide Films
使用各种过渡金属氧化物薄膜改善互补电致变色器件的特性
  • 批准号:
    01550010
  • 财政年份:
    1989
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似国自然基金

恐怖主义数字货币融资交易实体角色识别与知识图谱分析方法研究
  • 批准号:
    72171115
  • 批准年份:
    2021
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
基于角色多语义特征识别的动漫版权认证技术研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    36 万元
  • 项目类别:
    地区科学基金项目
融合多特征的藏文事件属性信息抽取理论与方法研究
  • 批准号:
    61762076
  • 批准年份:
    2017
  • 资助金额:
    37.0 万元
  • 项目类别:
    地区科学基金项目
LGP2在大黄鱼免疫识别过程中的角色与调控
  • 批准号:
    31402273
  • 批准年份:
    2014
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
多摄像机视频监控中的人物角色分类技术研究
  • 批准号:
    60903072
  • 批准年份:
    2009
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Coordinated Promotion Initiative for the Further Development of Optical Character Recognition (OCR) Techniques
进一步发展光学字符识别(OCR)技术的协调推进计划
  • 批准号:
    409784275
  • 财政年份:
    2018
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
Improvement of layout analysis and character area recognition for extracting digital text from modern books
改进布局分析和字符区域识别以从现代书籍中提取数字文本
  • 批准号:
    18K18330
  • 财政年份:
    2018
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Low Resolution OCR for Portable Devices to Assist the Visually Impaired
适用于便携式设备的低分辨率 OCR 为视障人士提供帮助
  • 批准号:
    7480848
  • 财政年份:
    2008
  • 资助金额:
    $ 6.72万
  • 项目类别:
Study on High Accuracy for Historical Character Recognition
高精度历史人物识别研究
  • 批准号:
    14380184
  • 财政年份:
    2002
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了