AI-based document preprocessing for optical character recognition

基于人工智能的光学字符识别文档预处理

基本信息

  • 批准号:
    567474-2021
  • 负责人:
  • 金额:
    $ 2.35万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Alliance Grants
  • 财政年份:
    2021
  • 资助国家:
    加拿大
  • 起止时间:
    2021-01-01 至 2022-12-31
  • 项目状态:
    已结题

项目摘要

Even though automated optical character recognition (OCR) is now a mature technology, it is facing a new challenge these days: sources of documents are now coming from pictures taken by multiple sources including mobile cameras. These images contain significant variations in lighting, distortion, and other artifacts that lowers the accuracy of OCR algorithms. In this research, model OCR as an unknown-box and improve image quality by deep learning-based algorithms suitable for the unknown-box. The unknown-box assumption accurately reflects a reality where end-users do not have access to the components of the OCR, e.g., proprietary software. Our proposed method to improve image quality relies on state-of-the-art advancements in image analysis and computer vision algorithms. The industry partner for the research is Inuit, Inc. and Intuit, Canada who are one of the leaders in automated document processing.
尽管自动光学字符识别(OCR)现在已经是一项成熟的技术,但它现在面临着新的挑战:文档来源现在来自包括移动相机在内的多个来源拍摄的图片。这些图像包含明显的光照变化、失真和其他伪像,从而降低了 OCR 算法的准确性。在本研究中,将 OCR 建模为未知框,并通过适合未知框的基于深度学习的算法来提高图像质量。未知框假设准确地反映了最终用户无法访问 OCR 组件(例如专有软件)的现实。我们提出的提高图像质量的方法依赖于图像分析和计算机视觉算法的最先进进步。该研究的行业合作伙伴是 Inuit, Inc. 和加拿大 Intuit,它们是自动化文档处理领域的领导者之一。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ray, Nilanjan其他文献

Intravital leukocyte detection using the gradient inverse coefficient of variation.
使用梯度逆变异系数进行活体白细胞检测。
  • DOI:
  • 发表时间:
    2005-07
  • 期刊:
  • 影响因子:
    10.6
  • 作者:
    Dong, Gang;Ray, Nilanjan;Acton, Scott T
  • 通讯作者:
    Acton, Scott T
Automatic segmentation of spinal cord MRI using symmetric boundary tracing.
使用对称边界追踪自动分割脊髓 MRI。
  • DOI:
  • 发表时间:
    2010-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mukherjee, Dipti Prasad;Cheng, Irene;Ray, Nilanjan;Mushahwar, Vivian;Lebel, Marc;Basu, Anup
  • 通讯作者:
    Basu, Anup
Motion gradient vector flow: an external force for tracking rolling leukocytes with shape and size constrained active contours.
运动梯度矢量流:用于跟踪形状和大小受限的活动轮廓的滚动白细胞的外力。
  • DOI:
  • 发表时间:
    2004-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ray, Nilanjan;Acton, Scott T
  • 通讯作者:
    Acton, Scott T
MISTICA: Minimum Spanning Tree-Based Coarse Image Alignment for Microscopy Image Sequences.
MISTICA:用于显微图像序列的基于最小生成树的粗图像对齐。
  • DOI:
  • 发表时间:
    2016-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ray, Nilanjan;McArdle, Sara;Ley, Klaus;Acton, Scott T
  • 通讯作者:
    Acton, Scott T
Data acceptance for automated leukocyte tracking through segmentation of spatiotemporal images.
通过时空图像分割自动白细胞跟踪的数据接受。
  • DOI:
  • 发表时间:
    2005-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ray, Nilanjan;Acton, Scott T
  • 通讯作者:
    Acton, Scott T

Ray, Nilanjan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ray, Nilanjan', 18)}}的其他基金

Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2021
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2021
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2020
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Differentiable Programming for Computer Vision and Medical Image Analysis
计算机视觉和医学图像分析的可微分编程
  • 批准号:
    RGPIN-2020-04139
  • 财政年份:
    2020
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based Screening for Breast Cancer Treatment
基于人工智能的乳腺癌治疗筛查
  • 批准号:
    558274-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Alliance Grants
AI-based Screening for Breast Cancer Treatment
基于人工智能的乳腺癌治疗筛查
  • 批准号:
    558274-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Alliance Grants
Compressed Sensing for Computer Vision
计算机视觉的压缩感知
  • 批准号:
    RGPIN-2015-03796
  • 财政年份:
    2019
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual
Compressed Sensing for Computer Vision
计算机视觉的压缩感知
  • 批准号:
    RGPIN-2015-03796
  • 财政年份:
    2019
  • 资助金额:
    $ 2.35万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

基于人机协同拟态学习的富文档隐性模式与知识获取研究
  • 批准号:
    62306173
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于融合多层特征和深度哈希的甲骨文文档图像关键词检索
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于文档对象模型的地理信息表达与复用方法研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
对抗场景下基于失真模型的翻拍文档图像取证技术
  • 批准号:
    62072313
  • 批准年份:
    2020
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
基于深度学习的程序文档自动化生成技术研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    60 万元
  • 项目类别:

相似海外基金

Development of a cloud-based, self-report SUD intake system enabling primary care clinicians to routinely complete, implement, document, and bill for biopsychosocial assessments for the underserved
开发基于云的自我报告 SUD 摄入系统,使初级保健临床医生能够定期为服务不足的人群完成、实施、记录生物心理社会评估并开具账单
  • 批准号:
    10469898
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
Enhancing the Cloud-Readiness of Perceptual Computing Through Data Standardization Software
通过数据标准化软件增强感知计算的云就绪性
  • 批准号:
    10609245
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
A first in class, mechanism-guided, cell-based therapy for complex regional pain syndrome
针对复杂区域疼痛综合征的一流、机制引导、基于细胞的疗法
  • 批准号:
    10572041
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
Co-Use of Opioid Medications and Alcohol Prevention Study (COAPS)
阿片类药物与酒精预防研究 (COAPS) 的共同使用
  • 批准号:
    10433369
  • 财政年份:
    2022
  • 资助金额:
    $ 2.35万
  • 项目类别:
Mind Your Heart Intervention for American Indian Women
对美国印第安妇女进行心脏干预
  • 批准号:
    10285177
  • 财政年份:
    2021
  • 资助金额:
    $ 2.35万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了