少量の実データに基づく画像内文字認識及びその応用

基于少量真实数据的图像字符识别及其应用

基本信息

  • 批准号:
    22KJ0905
  • 负责人:
  • 金额:
    $ 1.47万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2023
  • 资助国家:
    日本
  • 起止时间:
    2023-03-08 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

目的「少量の実データに基づく画像内文字認識及びその応用」に合う研究を順調に進めた。まず、計画通りに、合成データで作り難い、難しいデータの例として「漫画内のオノマトペテキスト」に注目し、それらを集めたデータセットを作成して公開した。オノマトペテキストは、合成で作り難い分、少量の実データを上手く活用して認識する必要があり、それに役立ついくつかの手法を適用して、精度を改善した。その内容を、7月には国内の最大級画像処理学会MIRUにて発表し、MIRUインタラクティブ発表賞を頂いた。また、10月に画像処理系のトップ国際学会ECCVでも発表した。その後、研究課題の目的「少量の実データの有効活用」に繋がる別の研究として、少量の文字画像(character image)を有効活用する研究を行っている。具体的には、複数の文字画像を組み合わせて、一つの疑似単語画像(word image)を作る研究を勧めている。文字画像が多ければ多いほど、文字画像を組み合わせるパターンは膨大な数になるため、文字画像を組み合わせることで、膨大な量の「疑似単語画像」を得られる。我々はこの組み合わせで作った「疑似単語画像」が、少量の単語画像を補うのに有効的であることを示した。今現在トップ国際会議ICCVに提出して、結果を待っている。今後は、この研究の改善や拡張を行う予定である。
我们在满足“基于少量真实数据的图像字符识别及其应用”目标的研究方面取得了良好进展。首先,按照计划,我们将“漫画中的拟声词文本”作为难以用合成数据创建的困难数据的一个例子,并创建并发布了收集该数据的数据集。由于拟声词文本很难通过合成来创建,因此需要充分利用少量的真实数据来识别它,我们应用了多种有用的技术来提高准确性。 7 月,我们在日本最大的图像处理会议之一 MIRU 上展示了我们的成果,并获得了 MIRU 互动演示奖。 10 月份,我们还在图像处理系统国际顶级会议 ECCV 上展示了我们的工作。之后,我正在对少量角色图像的有效利用进行研究,作为一项单独的研究,与我的研究主题“有效利用少量真实数据”的目的相关。具体来说,他建议进行将多个字符图像组合起来以创建单个伪单词图像的研究。字符图像越多,能够与字符图像组合的图案数量就越多,因此通过组合字符图像,可以获得海量的“伪文字图像”。我们表明,用这种组合创建的“伪单词图像”可以有效地补充少量单词图像。我现在已经提交给国际顶级会议ICCV,正在等待结果。未来,我们计划改进和扩大这项研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts
COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary Text
COO:用于识别任意文本的漫画拟声词数据集
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa
  • 通讯作者:
    Kiyoharu Aizawa
What If We Only Use Real Datasets for Scene Text Recognition?
如果我们只使用真实数据集进行场景文本识别会怎么样?
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa;Jeonghun Baek
  • 通讯作者:
    Jeonghun Baek
漫画内オノマトペデータセット及びそれの認識を行うコード
漫画拟声词数据集和识别代码
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
COO: きわめて 不規則なテキストを 含む漫画オノマトペデータセット
COO:具有高度不规则文本的漫画拟声词数据集
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa
  • 通讯作者:
    Kiyoharu Aizawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

白 定勳其他文献

感情推定結果に基づく人間が気に入る行動の選択
根据情绪估计结果选择人类喜欢的动作
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    熊谷 和実;白 定勳;水内 郁夫
  • 通讯作者:
    水内 郁夫
Human-Inspired Robot Design of Hardware and Software
仿人机器人软硬件设计
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    熊谷 和実;白 定勳;水内 郁夫;水内 郁夫;Ikuo Mizuuchi
  • 通讯作者:
    Ikuo Mizuuchi
人間の主観的プロセスを再現する試みと可能性
再现人类主观过程的尝试和可能性
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    熊谷 和実;白 定勳;水内 郁夫;水内 郁夫
  • 通讯作者:
    水内 郁夫

白 定勳的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

The influence of firm-bank relationship on post-IPO performance
企业与银行关系对IPO后绩效的影响
  • 批准号:
    25780256
  • 财政年份:
    2013
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了