线条图像理解方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61673029
- 项目类别:面上项目
- 资助金额:60.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:Ching Y. Suen; 吕肖庆; 武巧英; 郑金鑫; 周亚峰; 刘希诚; 符松平; 何哲琪; 郭婷;
- 关键词:
项目摘要
With the rise of many new applications in the field of mobile reading and mobile education, automatic understanding of line drawing images (such as page images of comics, and geometric figures in textbooks) has become an urgent problem. Aiming to solve this very challenging problem, this project focuses on the research of object detection and recognition in line drawing images, 3-D reconstruction of solid objects, and the semantic classification of line drawing images. In this project, we will develop a robust and efficient method for geometric object recognition, with the capability of model selection; and study how to use the prior knowledge about page layout to train a deep neural network with semi-supervised learning for the tasks of non-geometric objects recognition and semantic line drawing image classification, and how to use deep learning and conditional random field together for the task of semantic line drawing image segmentation. Moreover, we will also try to find a feasible 3D reconstruction method for non-geometric solid objects. The achievement of this project will fill in the gap of research on line drawing image understanding, and provide key technical support for the new applications in the publication and education industries. Therefore, this project has great scientific significance and economical values.
随着移动阅读与移动教育领域内许多新的应用的兴起,对漫画、绘本、几何图形等线条图像的语义理解成为了一个亟待解决的新问题。本项目将针对该问题,结合具体的应用需求,对该类图像所包含对象(几何对象和非几何对象)的识别方法、立体对象的三维重建方法,及其语义分类方法开展研究。特别地,本项目将研究一种高效、鲁棒、而且具有模型辨识能力的几何对象识别方法;将在吸收当前自然图像理解领域最新成果的基础上,研究如何根据线条图像数据先验知识使用弱监督深度学习来完成非几何对象识别以及非几何线条图像分类任务,如何综合使用深度学习和条件随机场来完成非几何对象语义分割任务;并针对非几何立体对象探索出一种可行的三维重建方法。本项目研究成果将填补现有文档图像理解领域国内外研究空白,为移动阅读与移动教育相关应用提供关键技术支持,因此本项目具有十分重要的研究意义。
结项摘要
本项目面向移动阅读与移动教育领域内许多新兴应用需求,对漫画、绘本、几何图形等线条图像的语义理解问题开展了相关研究,主要完成了四个方面的工作:1)实验数据收集、标记与评价方法构建,2) 线条图像所包含对象的识别方法研究,3) 线条图像语义分类与检索方法研究,4) 线条图像所包含立体对象的三维重建方法研究。本项目取得的主要进展如下:.(1)首次提出了基于深度学习的多边形物体检测方法,可适用于线条图像几何图形对象检测和自然图像几何形状物体检测,该方法具有较高的学术和应用价值,相关应用成果陆续在AAAI 2017、MM 2018、Pattern Recognition发表高水平论文3篇。.(2)系统地提出了基于深度学习的弱监督和有监督漫画人物角色识别方法,达到了接近实用的技术水平,在漫画版权保护、互联网漫画内容监管等方面具有较高的应用价值。.(3)提出了基于深度学习的立体几何图像三位重建方法,达到了可实用的技术水平,在移动教育方向有具有较高的应用价值。.(4)先后提出了多个通用目标检测方法,具有较高的学术和应用价值,相关成果陆续在ACCV 2018、AAAI 2019、 AAAI 2020上发表高水平论文3篇,在国际评测数据集MS COCO上取得了领先的结果,并在2项目标检测国际竞赛中获得领先的成绩,受到了学术界和工业界的广泛关注和引用,取得了非常不错的学术影响力。.(5)系统地提出了高精度场景文字检测和识别方法,具有较高的学术和应用价值,相关成果陆续在ICME 2019、MTAP、 PR发表高水平论文3篇,在多个国际评测数据集上取得了领先的检测和识别结果,并获得两项场景文字检测国际竞赛冠军,相关场景文字识别技术在蚂蚁金服的线上产品中得到了落地应用。.本项目相关研究成果目前共发表学术论文25篇(含CCF A类会议论文5篇、CCF B类会议/期刊论文7篇),并申请相关专利4项(已获授权1项),场景文字识别研究成果得到了落地应用,证明了本项目研究成果具有较高的学术价值和应用价值。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(21)
专利数量(4)
Synthesizing data for text recognition with style transfer
通过风格迁移合成文本识别数据
- DOI:10.1007/s11042-018-6656-3
- 发表时间:2018-09
- 期刊:Multimedia Tools and Applications
- 影响因子:3.6
- 作者:Li Jiahui;Wang Siwei;Wang Yongtao;Tang Zhi
- 通讯作者:Tang Zhi
一种基于图塌缩的药物分子检索方法
- DOI:--
- 发表时间:2018
- 期刊:北京大学学报(医学版)
- 影响因子:--
- 作者:瞿经纬;吕肖庆;刘振明;廖媛;孙鹏晖;王蓓;汤帜
- 通讯作者:汤帜
A Retrieval System of Medicine Molecules Based on Graph Similarity
基于图相似度的药物分子检索系统
- DOI:10.1109/mmul.2019.2902092
- 发表时间:2019-10
- 期刊:IEEE Multimedia
- 影响因子:3.2
- 作者:Qu Jingwei;Lu Xiaoqing;Zhang Chengcui;Sun Penghui;Li Xin;Wang Bei;Tang Zhi
- 通讯作者:Tang Zhi
A quadrilateral scene text detector with two-stage network architecture
具有两级网络架构的四边形场景文本检测器
- DOI:10.1016/j.patcog.2020.107230
- 发表时间:2020-06
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Wang Siwei;Liu Yudong;He Zheqi;Wang Yongtao;Tang Zhi
- 通讯作者:Tang Zhi
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于极限分析理论的复合地层中双模盾构开挖面稳定性研究
- DOI:--
- 发表时间:--
- 期刊:土木与环境工程学报(中英文)
- 影响因子:--
- 作者:黄阜;陈晶晶;王勇涛;杨云强;谭瑞
- 通讯作者:谭瑞
siRNA靶向沉默Smad7对PC12细胞氧糖剥夺敏感性的影响
- DOI:--
- 发表时间:2014
- 期刊:中国老年学杂志
- 影响因子:--
- 作者:王一鸣;程也;付丹阳;王勇涛;王姣琦;梅春丽;莽靖;徐忠信
- 通讯作者:徐忠信
ELISA法检测血清中CD44v5含量用于食管鳞癌筛检的初步研究
- DOI:--
- 发表时间:2015
- 期刊:实用医学杂志
- 影响因子:--
- 作者:王兴名;王洪江;张园;王勇涛
- 通讯作者:王勇涛
EphA2表达水平与食管鳞癌临床病理特征关系研究
- DOI:--
- 发表时间:2015
- 期刊:中国全科医学
- 影响因子:--
- 作者:王洪江;王勇涛;王兴名
- 通讯作者:王兴名
下调Smad7表达对PC12细胞OGD损伤的影响
- DOI:--
- 发表时间:2014
- 期刊:中国实验诊断学
- 影响因子:--
- 作者:王一鸣;程也;付丹阳;王勇涛;王姣琦;梅春丽;莽靖;徐忠信
- 通讯作者:徐忠信
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王勇涛的其他基金
基于神经网络架构搜索的目标检测方法研究
- 批准号:62176007
- 批准年份:2021
- 资助金额:58.00 万元
- 项目类别:面上项目
基于神经网络架构搜索的目标检测方法研究
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
面向移动阅读的复杂文档图像理解方法研究
- 批准号:61300061
- 批准年份:2013
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}