线条图像理解方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61673029
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0605.模式识别与数据挖掘
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

With the rise of many new applications in the field of mobile reading and mobile education, automatic understanding of line drawing images (such as page images of comics, and geometric figures in textbooks) has become an urgent problem. Aiming to solve this very challenging problem, this project focuses on the research of object detection and recognition in line drawing images, 3-D reconstruction of solid objects, and the semantic classification of line drawing images. In this project, we will develop a robust and efficient method for geometric object recognition, with the capability of model selection; and study how to use the prior knowledge about page layout to train a deep neural network with semi-supervised learning for the tasks of non-geometric objects recognition and semantic line drawing image classification, and how to use deep learning and conditional random field together for the task of semantic line drawing image segmentation. Moreover, we will also try to find a feasible 3D reconstruction method for non-geometric solid objects. The achievement of this project will fill in the gap of research on line drawing image understanding, and provide key technical support for the new applications in the publication and education industries. Therefore, this project has great scientific significance and economical values.
随着移动阅读与移动教育领域内许多新的应用的兴起,对漫画、绘本、几何图形等线条图像的语义理解成为了一个亟待解决的新问题。本项目将针对该问题,结合具体的应用需求,对该类图像所包含对象(几何对象和非几何对象)的识别方法、立体对象的三维重建方法,及其语义分类方法开展研究。特别地,本项目将研究一种高效、鲁棒、而且具有模型辨识能力的几何对象识别方法;将在吸收当前自然图像理解领域最新成果的基础上,研究如何根据线条图像数据先验知识使用弱监督深度学习来完成非几何对象识别以及非几何线条图像分类任务,如何综合使用深度学习和条件随机场来完成非几何对象语义分割任务;并针对非几何立体对象探索出一种可行的三维重建方法。本项目研究成果将填补现有文档图像理解领域国内外研究空白,为移动阅读与移动教育相关应用提供关键技术支持,因此本项目具有十分重要的研究意义。

结项摘要

本项目面向移动阅读与移动教育领域内许多新兴应用需求,对漫画、绘本、几何图形等线条图像的语义理解问题开展了相关研究,主要完成了四个方面的工作:1)实验数据收集、标记与评价方法构建,2) 线条图像所包含对象的识别方法研究,3) 线条图像语义分类与检索方法研究,4) 线条图像所包含立体对象的三维重建方法研究。本项目取得的主要进展如下:.(1)首次提出了基于深度学习的多边形物体检测方法,可适用于线条图像几何图形对象检测和自然图像几何形状物体检测,该方法具有较高的学术和应用价值,相关应用成果陆续在AAAI 2017、MM 2018、Pattern Recognition发表高水平论文3篇。.(2)系统地提出了基于深度学习的弱监督和有监督漫画人物角色识别方法,达到了接近实用的技术水平,在漫画版权保护、互联网漫画内容监管等方面具有较高的应用价值。.(3)提出了基于深度学习的立体几何图像三位重建方法,达到了可实用的技术水平,在移动教育方向有具有较高的应用价值。.(4)先后提出了多个通用目标检测方法,具有较高的学术和应用价值,相关成果陆续在ACCV 2018、AAAI 2019、 AAAI 2020上发表高水平论文3篇,在国际评测数据集MS COCO上取得了领先的结果,并在2项目标检测国际竞赛中获得领先的成绩,受到了学术界和工业界的广泛关注和引用,取得了非常不错的学术影响力。.(5)系统地提出了高精度场景文字检测和识别方法,具有较高的学术和应用价值,相关成果陆续在ICME 2019、MTAP、 PR发表高水平论文3篇,在多个国际评测数据集上取得了领先的检测和识别结果,并获得两项场景文字检测国际竞赛冠军,相关场景文字识别技术在蚂蚁金服的线上产品中得到了落地应用。.本项目相关研究成果目前共发表学术论文25篇(含CCF A类会议论文5篇、CCF B类会议/期刊论文7篇),并申请相关专利4项(已获授权1项),场景文字识别研究成果得到了落地应用,证明了本项目研究成果具有较高的学术价值和应用价值。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(21)
专利数量(4)
Synthesizing data for text recognition with style transfer
通过风格迁移合成文本识别数据
  • DOI:
    10.1007/s11042-018-6656-3
  • 发表时间:
    2018-09
  • 期刊:
    Multimedia Tools and Applications
  • 影响因子:
    3.6
  • 作者:
    Li Jiahui;Wang Siwei;Wang Yongtao;Tang Zhi
  • 通讯作者:
    Tang Zhi
一种基于图塌缩的药物分子检索方法
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    北京大学学报(医学版)
  • 影响因子:
    --
  • 作者:
    瞿经纬;吕肖庆;刘振明;廖媛;孙鹏晖;王蓓;汤帜
  • 通讯作者:
    汤帜
A Retrieval System of Medicine Molecules Based on Graph Similarity
基于图相似度的药物分子检索系统
  • DOI:
    10.1109/mmul.2019.2902092
  • 发表时间:
    2019-10
  • 期刊:
    IEEE Multimedia
  • 影响因子:
    3.2
  • 作者:
    Qu Jingwei;Lu Xiaoqing;Zhang Chengcui;Sun Penghui;Li Xin;Wang Bei;Tang Zhi
  • 通讯作者:
    Tang Zhi
A quadrilateral scene text detector with two-stage network architecture
具有两级网络架构的四边形场景文本检测器
  • DOI:
    10.1016/j.patcog.2020.107230
  • 发表时间:
    2020-06
  • 期刊:
    Pattern Recognition
  • 影响因子:
    8
  • 作者:
    Wang Siwei;Liu Yudong;He Zheqi;Wang Yongtao;Tang Zhi
  • 通讯作者:
    Tang Zhi

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于极限分析理论的复合地层中双模盾构开挖面稳定性研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    土木与环境工程学报(中英文)
  • 影响因子:
    --
  • 作者:
    黄阜;陈晶晶;王勇涛;杨云强;谭瑞
  • 通讯作者:
    谭瑞
siRNA靶向沉默Smad7对PC12细胞氧糖剥夺敏感性的影响
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中国老年学杂志
  • 影响因子:
    --
  • 作者:
    王一鸣;程也;付丹阳;王勇涛;王姣琦;梅春丽;莽靖;徐忠信
  • 通讯作者:
    徐忠信
ELISA法检测血清中CD44v5含量用于食管鳞癌筛检的初步研究
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    实用医学杂志
  • 影响因子:
    --
  • 作者:
    王兴名;王洪江;张园;王勇涛
  • 通讯作者:
    王勇涛
EphA2表达水平与食管鳞癌临床病理特征关系研究
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    中国全科医学
  • 影响因子:
    --
  • 作者:
    王洪江;王勇涛;王兴名
  • 通讯作者:
    王兴名
下调Smad7表达对PC12细胞OGD损伤的影响
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中国实验诊断学
  • 影响因子:
    --
  • 作者:
    王一鸣;程也;付丹阳;王勇涛;王姣琦;梅春丽;莽靖;徐忠信
  • 通讯作者:
    徐忠信

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王勇涛的其他基金

基于神经网络架构搜索的目标检测方法研究
  • 批准号:
    62176007
  • 批准年份:
    2021
  • 资助金额:
    58.00 万元
  • 项目类别:
    面上项目
基于神经网络架构搜索的目标检测方法研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
面向移动阅读的复杂文档图像理解方法研究
  • 批准号:
    61300061
  • 批准年份:
    2013
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码