基于视觉关系学习的弱监督图像理解研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61876212
  • 项目类别:
    面上项目
  • 资助金额:
    65.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0604.机器感知与机器视觉
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

In the era of big visual data, weakly supervised visual understanding has become a hot topic in computer vision since it can significantly reduce human labeling efforts. In this project, we propose a novel weakly supervised visual understanding framework based on visual affinity learning (VAL), and perform comprehensive research on the visual representation, solutions and applications of VAL. Motivated by a second-order representation of visual elements, we propose VAL methods including an efficient, uniform and multi-scale visual affinity representation. To learn visual affinity, we embed visual affinity in deep networks; at the same time, the visual affinity embeddings enhance the power of deep networks. In weakly supervised settings, we propose novel methods for robustly inferring visual affinity based on multi-instance learning, transfer learning and pre-training of big video data. In applications. we propose the first weakly supervised object detection network without hand-crafted object proposal based on visual affinity embeddings, affinity cuts and multi-task learning. The proposed technologies can significantly reduce the human labeling efforts of training object detection networks and semantic segmentation networks in the applications in autonomous driving and video surveillance etc. Generally speaking, the research works speedup the landing of AI applications.
在视觉大数据的时代,由于能够显著的降低数据标记成本,弱监督图像理解成为了计算机视觉中的一个热点问题。本项目提出了一个基于视觉关系学习的弱监督图像理解框架,并在表达、求解和应用三个层面展开了深入研究。在表达层面,从图像视频中视觉元素的二阶表示出发,本项目提出了视觉关系学习方法,及其高效、统一、多尺度表达,并采用深度网络对关系表达进行端到端的优化,增强了深度神经网络的建模能力。在求解层面,采用多示例学习、迁移学习、海量视频数据预训练等手段,本项目解决了弱监督条件下视觉关系作为隐变量难以稳健求解的问题。在应用层面,本项目提出了首个可以自动产生物体候选的端到端弱监督物体检测网络,通过关系嵌入、关系切割、多任务学习等手段,解决了传统弱监督物体检测网络中无法产生物体候选的难题。本项目的研究工作能显著减少自动驾驶、视频监控等环境中的图像理解应用中的人工标记工作量,从而加快人工智能应用的落地速度。

结项摘要

视觉理解是人工智能系统中的一个关键任务,弱监督图像理解符合人类视觉认知规律且能够显著的降低视觉感知系统的落地应用成本,受到了国内外研究者的广泛关注。本项目从视觉关系的建模出发,以自注意力机制为核心,设计了一整套像素-目标-场景的弱监督高效率图像理解框架,具体的研究成果如下:(1)在视觉关系的建模层面,在领域内首创了基于Query表示的实例分割算法(QueryInst,ICCV 2021),提出了首个基于纯序列到序列的目标检测算法(YOLOS,NeurIPS 2021),以及面向高效视频实例分割的交叉学习机制(CrossVIS,ICCV 2021),相关方法在业内公认的权威评测集(MS COCO)上取得了最优的精度和速度权衡,并获得了YouteVIS大规模视频物体分割竞赛全球亚军,对于高质量图像分割和目标检测提供了新的设计范式,为大规模预训练的视觉基础模型的落地应用提供了低成本、灵活的实践框架。(2)在视觉关系的高效推断方面,首创了空间稀疏自注意力机制(CCNet,TPAMI 2020),以及高效率神经网络架构搜索迁移学习机制(FNA++,TPAMI 2021),在自动驾驶语义分割评测集(cityscapes)上取得了业内领先结果,大幅度提升神经网络架构搜索的速度(相对谷歌公司的DPC竞品方法搜索速度提升了1700倍),破解了稠密视觉自注意力计算复杂度高的难题,作为骨干网络在蛋白质解译AI(AlphaFold,Nature封面文章)应用,并落地应用在华为、地平线的AI芯片当中。(3)在弱监督物体检测和分割问题上,发展了一系列深度学习多示例网络(BSN,InfoSci 2019),提出了融入外部知识的类别无关弱监督物体分割方法(BoxCaseg, CVPR 2021),在弱监督实例分割、弱监督物体检测的标准评测集上取得了业内领先结果。项目第一标注论文谷歌引用超过3670次,项目负责人入选国家级人才计划,获CSIG青年科学家奖,吴文俊人工智能优秀青年奖。

项目成果

期刊论文数量(23)
专著数量(0)
科研奖励数量(2)
会议论文数量(21)
专利数量(7)
Bag similarity network for deep multi-instance learning
用于深度多实例学习的袋相似性网络
  • DOI:
    10.1016/j.ins.2019.07.071
  • 发表时间:
    2019
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    Wang Xinggang;Yan Yongluan;Tang Peng;Liu Wenyu;Guo Xiaojie
  • 通讯作者:
    Guo Xiaojie
Weakly- and Semi-Supervised Fast Region-Based CNN for Object Detection
用于目标检测的弱监督和半监督快速区域 CNN
  • DOI:
    10.1007/s11390-019-1975-z
  • 发表时间:
    2019
  • 期刊:
    Journal of Computer Science and Technology
  • 影响因子:
    1.9
  • 作者:
    Wang Xinggang;Wang Jia-Si;Tang Peng;Liu Wen-Yu
  • 通讯作者:
    Liu Wen-Yu
EAT-NAS: elastic architecture transfer for accelerating large-scale neural architecture search
EAT-NAS:用于加速大规模神经架构搜索的弹性架构传输
  • DOI:
    10.1007/s11432-020-3112-8
  • 发表时间:
    2021
  • 期刊:
    Science China Information Sciences
  • 影响因子:
    --
  • 作者:
    Fang Jiemin;Chen Yukang;Zhang Xinbang;Zhang Qian;Huang Chang;Meng Gaofeng;Liu Wenyu;Wang Xinggang
  • 通讯作者:
    Wang Xinggang
Deep multi-metric learning for text-independent speaker verification
用于与文本无关的说话人验证的深度多度量学习
  • DOI:
    10.1016/j.neucom.2020.06.045
  • 发表时间:
    2020
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Xu Jiwei;Wang Xinggang;Feng Bin;Liu Wenyu
  • 通讯作者:
    Liu Wenyu
A Weakly-Supervised Framework for COVID-19 Classification and Lesion Localization From Chest CT
胸部 CT 的 COVID-19 分类和病变定位的弱监督框架
  • DOI:
    10.1109/tmi.2020.2995965
  • 发表时间:
    2020
  • 期刊:
    IEEE Transactions on Medical Imaging
  • 影响因子:
    10.6
  • 作者:
    Wang Xinggang;Deng Xianbo;Fu Qing;Zhou Qiang;Feng Jiapei;Ma Hui;Liu Wenyu;Zheng Chuansheng
  • 通讯作者:
    Zheng Chuansheng

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

方柱绕流CFX三维数值模拟
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    水动力学研究与进展A辑
  • 影响因子:
    --
  • 作者:
    付英男;赵西增;王兴刚
  • 通讯作者:
    王兴刚
辉光放电等离子体引发聚合制备聚丙烯酸/凹凸棒超强吸水材料及性能研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    西北师范大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    俞洁;杨武;王兴刚;杨珍珍;高锦章;朱文娟;李岩
  • 通讯作者:
    李岩
基于CIP方法的液滴冲击薄膜数值模拟
  • DOI:
    10.16076/j.cnki.cjhd.2015.03.005
  • 发表时间:
    2015
  • 期刊:
    水动力学研究与进展A辑
  • 影响因子:
    --
  • 作者:
    叶洲腾;赵西增;王兴刚
  • 通讯作者:
    王兴刚
方柱绕流CFX三维数值模拟
  • DOI:
    10.16076/j.cnki.cjhd.2015.04.004
  • 发表时间:
    2015
  • 期刊:
    水动力学研究与进展A辑
  • 影响因子:
    --
  • 作者:
    付英男;赵西增;王兴刚
  • 通讯作者:
    王兴刚
离子液体中辉光放电电解等离子体合成聚甲基丙烯酸甲酯
  • DOI:
    10.1007/s13280-021-01662-3
  • 发表时间:
    --
  • 期刊:
    西北师范大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    朱文娟;李岩;王兴刚;高锦章;杨珍珍;杨武
  • 通讯作者:
    杨武

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王兴刚的其他基金

开放场景大规模弱监督物体检测分割
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于区分型码本的图像表示的研究与应用
  • 批准号:
    61503145
  • 批准年份:
    2015
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码