基于区分型码本的图像表示的研究与应用
项目介绍
AI项目解读
基本信息
- 批准号:61503145
- 项目类别:青年科学基金项目
- 资助金额:22.0万
- 负责人:
- 依托单位:
- 学科分类:F0604.机器感知与机器视觉
- 结题年份:2018
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2018-12-31
- 项目参与者:姚聪; 柏松; 陈攀; 李超; 姜玉静; 段雄; 黄子龙;
- 关键词:
项目摘要
Feature set based image representation is an important yet challenging problem in computer vision and machine learning, which plays a critical role in a wide spectrum of applications. In this project, we propose a novel image representation method based on discriminative codebook. Comparing to the state-of-the-art data representation methods using generative codebook, main advantages of discriminative codebook lie in the following three aspects: (1) it uses a new space partition strategy, which makes our codebook more compact; (2) it learns weights for each dimension of data, which helps to fuse different kinds of features; and (3) it contains high-level semantics. We focus on studying the characteristics of discriminative codebook, discriminative codebook learning approaches, coding approaches of discriminative codebook, image representation using discriminative codebook, and how to apply the proposed image representation for large-scale image classification, object detection etc. The research in this project helps to solve the fundamental problems in machine learning and computer vision, such as discriminative clustering, weakly supervised learning and object recognition. Besides, the flexibility of our discriminative codebook learning method makes it possible to be widely applied to text, audio and other types of data, and thus promotes the development in the related areas.
基于特征集的图像表示是计算机视觉中十分核心且具有挑战性的问题,在诸多应用中发挥着重要作用。本项目拟提出一种新颖的基于区分型码本的图像表示方法,它具有三个主要优点:(1)采用了一种新的数据空间划分方式,使得图像表示更加简洁;(2)区分型码本自动学习样本各维度的权重,可以有效融合不同种类的特征;(3)能够在码本中融入人工标注的高层语义,使得图像表示更加高效。本课题研究焦点在于区分型码本的性质、学习方法、编码方法、图像表示、以及解决大规模数据下的图像分类、物体检测等应用问题。本课题中的研究有助于解决区分型聚类、弱监督学习、物体识别等机器学习、计算机视觉领域中的任务。另外,区分型码本是一种通用的码本表示方法,可以应用于文本、音频等多媒体数据的表示,并推动相关领域的研究发展。
结项摘要
图像的表示是计算机视觉中的核心问题,本项目中以区分型码本为中心来研究新型的图像表示方法,在基于深度学习的区分型码本学习、多示例神经网络、弱监督图像理解三个方面的内容展开了深入的研究。在区分型码本学习方面,本项目提出了以Deep Patch Learning和FisherNet为代表的方法,在标准测试PASCAL VOC上以较少量的计算取得了业界最好的物体分类性能;其科学意义在于利用局部特征学习使能小尺度物体分类,以及通过区分式学习构建精简的图像表示,从而同时获得高精高速的图像分类网络。在多示例神经网络方面,本项目提出了采用深度学习的形式和端到端优化的方法来求解多示例学习问题,在几乎所有的多示例学习标准测试集上都取得了业内最好的性能。其科学意义在于通过深度神经网络来有效求解集合预测问题,揭示了对于多示例具有交换不变性的神经网络的重要性。在弱监督图像理解方面,本项目提出了一系列优秀的弱监督物体检测和语义分割方法,例如:OICR、WeakRPN、DSRG、PCL等,是目前效果最好的弱监督图像理解系统,取得了较大的影响力。其科学意义在于揭示了图像内在信息分布的平滑性对于弱监督图像理解的重要性,并利用这种平滑性来让物体检测网络和语义分割网络进行自监督学习。相关研究成果可以用于在医学图像分析、互联网图像搜索等领域构建大规模的图像识别系统中应用。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(2)
Deep attention network for joint hand gesture localization and recognition using static RGB-D images
使用静态 RGB-D 图像进行联合手势定位和识别的深度注意力网络
- DOI:--
- 发表时间:2018
- 期刊:Information Science
- 影响因子:--
- 作者:Yuan Li;Xinggang Wang;Wenyu Liu;Bin Feng
- 通讯作者:Bin Feng
Deep Patch Learning for Weakly Supervised Object Classification and Discovery. Pattern Recognition
用于弱监督对象分类和发现的深度补丁学习。
- DOI:--
- 发表时间:2017
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Peng Tang;Xinggang Wang;Zilong Huang;Xiang Bai;Wenyu Liu
- 通讯作者:Wenyu Liu
Deep FisherNet for Image Classification
用于图像分类的 Deep FisherNet
- DOI:--
- 发表时间:--
- 期刊:IEEE Transactions on Neural Networks and Learning Systems
- 影响因子:10.4
- 作者:Peng Tang;Xinggang Wang;Baoguang Shi;Xiang Bai;Wenyu Liu;Zhuowen Tu
- 通讯作者:Zhuowen Tu
Unsupervised local deep feature for image recognition
用于图像识别的无监督局部深度特征
- DOI:10.1016/j.ins.2016.02.044
- 发表时间:2016
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Yang Wang;Xinggang Wang;Wenyu Liu
- 通讯作者:Wenyu Liu
Structured random forest for label distribution learning
用于标签分布学习的结构化随机森林
- DOI:--
- 发表时间:2018
- 期刊:Neuralcomputing
- 影响因子:--
- 作者:Mengting Chen;Xinggang Wang;Bin Feng;Wenyu Liu
- 通讯作者:Wenyu Liu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
方柱绕流CFX三维数值模拟
- DOI:--
- 发表时间:2015
- 期刊:水动力学研究与进展A辑
- 影响因子:--
- 作者:付英男;赵西增;王兴刚
- 通讯作者:王兴刚
辉光放电等离子体引发聚合制备聚丙烯酸/凹凸棒超强吸水材料及性能研究
- DOI:--
- 发表时间:--
- 期刊:西北师范大学学报(自然科学版)
- 影响因子:--
- 作者:俞洁;杨武;王兴刚;杨珍珍;高锦章;朱文娟;李岩
- 通讯作者:李岩
基于CIP方法的液滴冲击薄膜数值模拟
- DOI:10.16076/j.cnki.cjhd.2015.03.005
- 发表时间:2015
- 期刊:水动力学研究与进展A辑
- 影响因子:--
- 作者:叶洲腾;赵西增;王兴刚
- 通讯作者:王兴刚
方柱绕流CFX三维数值模拟
- DOI:10.16076/j.cnki.cjhd.2015.04.004
- 发表时间:2015
- 期刊:水动力学研究与进展A辑
- 影响因子:--
- 作者:付英男;赵西增;王兴刚
- 通讯作者:王兴刚
离子液体中辉光放电电解等离子体合成聚甲基丙烯酸甲酯
- DOI:10.1007/s13280-021-01662-3
- 发表时间:--
- 期刊:西北师范大学学报(自然科学版)
- 影响因子:--
- 作者:朱文娟;李岩;王兴刚;高锦章;杨珍珍;杨武
- 通讯作者:杨武
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王兴刚的其他基金
开放场景大规模弱监督物体检测分割
- 批准号:
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
基于视觉关系学习的弱监督图像理解研究
- 批准号:61876212
- 批准年份:2018
- 资助金额:65.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}