基于结构关系和知识学习的大规模视觉目标检索

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61772527
  • 项目类别:
    面上项目
  • 资助金额:
    70.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

With the rapid development of internet and storage techniques as well as the popular application of mobile terminal, it has been a hot topic to retrieve the visual object from the massive media data efficiently in the field of multimedia and computer vision. To solve the large-scale visual object retrieval problem, this project aims to conduct researches from the following aspects. Firstly, by analyzing the efficient appearance modeling and multi-level structural context in object image, we aim to study the efficient multi-view structural feature representation for viusal object. Secondly, by exploiting the rich semantic entity relationships and multi-granularit knowledge representation, we propose to learn the semantic object representation based on attribute modelling and knowledge learning. Thirdly, with the multi-component ranking approach based on deep learning, we can involve the efficient object representation and effective distance metric learning into an end-to-end framework by learning a compact and efficient deep embedding space. Finally, towards rapid and accurate visual retrieval, we study the feature compression and encoding method based on bagging deep hash networks.
随着互联网、存储技术的快速发展和移动设备的普及,如何从海量的图像和视频数据中高效准确的获取与用户查询相关的视觉目标,是多媒体和计算机视觉领域的研究热点之一。本项目针对大规模视觉目标检索任务,分析高效的深度特征表示、层次化空间结构上下文关系,研究视觉目标的多视角结构化目标表达;挖掘目标中蕴含的语义实体关系和多粒度知识表示,建立基于属性引导和知识驱动的目标语义模型;结合基于深度学习的多元排序学习方法,学习紧致高效的深度空间映射,建立目标特征表示和距离度量的联合学习框架;探讨基于模型集成的深度哈希编码方法,实现快速精准的视觉目标检索。

结项摘要

本项目针对大规模视觉目标检索任务,从高效的视觉特征表达和合理的特征距离度量两方面出发,围绕多视角结构化特征表达、目标属性建模与知识学习、多元排序度量学习、大规模视觉目标检索验证系统等方面开展深入研究,取得了一系列研究成果。代表性研究成果包括基于弱监督语义解析的行人检索、基于全卷积注意力耦合网络的目标特征表达、基于自适应类别抑制的长尾目标识别、基于部件解析和主题注意力机制的目标属性建模、基于图网络关系建模的多粒度特征学习方法、基于结构化特征度量学习的车辆检索、基于周期性矩衰减优化的大规模分布式神经网络训练框架等。项目执行期内,项目组共发表论文46篇,其中发表国际期刊论文18篇,包括IEEE TRANSACTIONS期刊论文6篇;发表国际会议论文28篇,其中包括CVPR/ECCV/ICCV/ACM MM/AAAI/IJCAI/NeurIPS等国际顶级会议论文18篇。此外,还申请国家发明专利8项。在项目的资助下,项目组成员有6人次出境参加国际学术会议。项目组积极开展与华为、阿里、京东、中国电子进出口、交通科学研究所等企业和事业单位的项目合作,在智慧安防、智慧交通、智能零售等领域进行大规模目标检索算法和系统的应用验证,并完成了一些核心技术的产业化和技术转移。项目执行期内,基于本项目研究成果,项目组成员获得了一系列国际学术竞赛或者行业技术应用奖项和荣誉,包括吴文俊人工智能科技进步二等奖、中国发明协会发明创新二等奖、IEEE VCIP国际车辆检索竞赛冠军、AI challenger全球AI挑战赛冠军等。总体来看,本项目按照计划完成了各项研究内容,研究成果达到了预期指标,实现了预期目标。

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(8)
会议论文数量(28)
专利数量(8)
A Comparison of Correlation Filter-Based Trackers and Struck Trackers
基于相关滤波器的跟踪器和打击跟踪器的比较
  • DOI:
    10.1109/tcsvt.2019.2931924
  • 发表时间:
    2020-09
  • 期刊:
    IEEE Trans. Circuits Syst. Video Technol
  • 影响因子:
    --
  • 作者:
    Jinqiao Wang;Linyu Zheng;Ming Tang;Jiayi Feng
  • 通讯作者:
    Jiayi Feng
STN-enhanced message passing guided by adversarial learning for human pose estimation
由对抗性学习引导的 STN 增强消息传递用于人体姿势估计
  • DOI:
    10.1016/j.neucom.2021.04.110
  • 发表时间:
    2021
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Lu Zhou;Yingying Chen;Congqi Cao;Jinqiao Wang;Hanqing Lu
  • 通讯作者:
    Hanqing Lu
A novel data augmentation scheme for pedestrian detection with attribute preserving GAN
一种新颖的数据增强方案,用于具有属性保留 GAN 的行人检测
  • DOI:
    10.1016/j.neucom.2020.02.094
  • 发表时间:
    2020-08-11
  • 期刊:
    NEUROCOMPUTING
  • 影响因子:
    6
  • 作者:
    Liu, Songyan;Guo, Haiyun;Tang, Ming
  • 通讯作者:
    Tang, Ming
Reading scene text with fully convolutional sequence modeling
使用全卷积序列建模读取场景文本
  • DOI:
    10.1016/j.neucom.2019.01.094
  • 发表时间:
    2019-04
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Gao Yunze;Chen Yingying;Wang Jinqiao;Tang Ming;Lu Hanqing
  • 通讯作者:
    Lu Hanqing
Two-Level Attention Network With Multi-Grain Ranking Loss for Vehicle Re-Identification
用于车辆重新识别的具有多粒度排名损失的两级注意力网络
  • DOI:
    10.1109/tip.2019.2910408
  • 发表时间:
    2019-09-01
  • 期刊:
    IEEE TRANSACTIONS ON IMAGE PROCESSING
  • 影响因子:
    10.6
  • 作者:
    Guo, Haiyun;Zhu, Kuan;Wang, Jinqiao
  • 通讯作者:
    Wang, Jinqiao

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于十字感受野网络的场景文本检测
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    无线电通信技术
  • 影响因子:
    --
  • 作者:
    赵旭;赵朝阳;杜晓杰;张振清;刘松岩;郭海云;唐明;王金桥
  • 通讯作者:
    王金桥
电动汽车专用轮胎发展趋势
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    汽车工程师
  • 影响因子:
    --
  • 作者:
    朱波;王海森;郑敏毅;张农;王金桥;汪跃中
  • 通讯作者:
    汪跃中

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王金桥的其他基金

基于局部关系与语义约束的视觉检索
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
面向移动终端的视频检索与浏览
  • 批准号:
    61273034
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
基于语义分析和视觉关注的视频自适应研究
  • 批准号:
    60905008
  • 批准年份:
    2009
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码