"Scalable Methods of Text and Structure Recognition for the Full-Text Digitization of Historical Prints" Part 2: Layout Analysis

“历史印刷品全文数字化的文本和结构识别的可扩展方法”第 2 部分:布局分析

基本信息

项目摘要

The project “Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke” has the goal of developing a complete OCR-Workflow for a high quality mass digitization of historical prints from the 16th-18th century. For each step in the workflow innovative methods should be made available as tools. Module 2: Layouterkennung ist next to OCR itself the most important step. It improves the OCR results directly, but also improves the general understanding of the digitized document by providing insights to the layout and relations between the document components. For each optimization step there are a wide variety of algorithms available, however not all of them are suitable to the specific challenges of this projects. On the basis of prior experience and work, the DFKI plans the identification, development and integration of suitable methods.
“Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke”项目的目标是开发一个完整的 OCR 工作流程,用于对 16 世纪至 18 世纪的历史印刷品进行高质量的大规模数字化,工作流程中的每一步都采用创新方法。模块 2:Layouterkennung 是仅次于 OCR 本身的最重要的工具。它直接改进了 OCR 结果,而且还通过提供对文档组件之间的布局和关系的洞察来提高对数字化文档的总体理解。对于每个优化步骤,都有多种可用的算法,但并非全部。适合该项目的具体挑战 根据先前的经验和工作,DFKI 计划确定、开发和整合合适的方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr. Andreas Dengel其他文献

Professor Dr. Andreas Dengel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr. Andreas Dengel', 18)}}的其他基金

metis II - Artificial intelligence methods for auto-completion of designs based on semantic building information (BIM) for supporting architects in early design phases.
metis II - 基于语义建筑信息 (BIM) 自动完成设计的人工智能方法,用于在早期设计阶段为建筑师提供支持。
  • 批准号:
    419390235
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    Research Grants
"Scalable Methods of Text and Structure Recognition for the Full-Text Digitization of Historical Prints" Part 1.B: Image Optimization
“用于历史印刷品全文数字化的文本和结构识别的可扩展方法”第 1.B 部分:图像优化
  • 批准号:
    394343055
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
Sustaining Grass-roots Organizational Memories: Methods and Effects of Applying Managed Forgetting in Administrative Corporate Scenarios
维持基层组织记忆:在企业行政场景中应用管理遗忘的方法和效果
  • 批准号:
    318396700
  • 财政年份:
    2016
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Linked Open Citation Database (LOC-DB) - Development of a Linked Open Data database for the indexing of citations of electronic and print media
链接开放引文数据库 (LOC-DB) - 开发链接开放数据数据库,用于电子和印刷媒体引文索引
  • 批准号:
    311018540
  • 财政年份:
    2016
  • 资助金额:
    --
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
metis - Knowledge-based search and query methods for accessing information of semantic models (BIM) to support searching in early design stages.
metis - 基于知识的搜索和查询方法,用于访问语义模型(BIM)信息以支持早期设计阶段的搜索。
  • 批准号:
    235841221
  • 财政年份:
    2013
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Neuronale Netze zur Beschreibung von Nachbarnetzen
用于描述邻近网络的神经网络
  • 批准号:
    5110362
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
learning Cyclotron
学习回旋加速器
  • 批准号:
    442581111
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

半配对图像-文本跨媒体数据的统一表征学习方法研究
  • 批准号:
    62306188
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
结构化文本引导的三维人体动作生成方法研究
  • 批准号:
    62306031
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于细粒度认知行为的长文本匹配方法研究
  • 批准号:
    62302040
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于异构概念漂移同现检测的短文本流半监督分类方法研究
  • 批准号:
    62376085
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
弱相关场景下视频文本语义对齐方法研究
  • 批准号:
    62302453
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Using Multiphase Optimization Strategy (MOST) to Optimize a Cost-effective, Sustainable and Scalable Smoking Cessation Package for Smokers in HIV Clinical Care
使用多阶段优化策略 (MOST) 为 HIV 临床护理中的吸烟者优化具有成本效益、可持续且可扩展的戒烟方案
  • 批准号:
    10548592
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
mHealth for suicide prevention: Design, development, and feasibility of a scalable SMS-based safety planning intervention
用于预防自杀的移动医疗:基于短信的可扩展安全规划干预措施的设计、开发和可行性
  • 批准号:
    10524928
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
mHealth for suicide prevention: Design, development, and feasibility of a scalable SMS-based safety planning intervention
用于预防自杀的移动医疗:基于短信的可扩展安全规划干预措施的设计、开发和可行性
  • 批准号:
    10654851
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Using Multiphase Optimization Strategy (MOST) to Optimize a Cost-effective, Sustainable and Scalable Smoking Cessation Package for Smokers in HIV Clinical Care
使用多阶段优化策略 (MOST) 为 HIV 临床护理中的吸烟者优化具有成本效益、可持续且可扩展的戒烟方案
  • 批准号:
    10649607
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
mHealth for suicide prevention: Design, development, and feasibility of a scalable SMS-based safety planning intervention
用于预防自杀的移动医疗:基于短信的可扩展安全规划干预措施的设计、开发和可行性
  • 批准号:
    10814677
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了