面向复杂图像与视频的高性能显著性检测研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61771301
  • 项目类别:
    面上项目
  • 资助金额:
    62.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0117.多媒体信息处理
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Recent years have witnessed the continuous development of research on saliency detection models. However, the test results on multiple image/video datasets show that the performances of the existing state-of-the-art saliency detection models significantly degrade on complicated images and complicated videos. This project will investigate three novel solutions to effectively elevate saliency detection performance. First, the deep convolutional networks are systematically constructed to realize the effective integration of region-level saliency measurement and pixel-level saliency fusion, and high-level semantic features and low-level visual features are sufficiently extracted in a multi-context multi-scale way, so as to effectively elevate saliency detection performance on complicated images. Then, the deep convolutional network based quality assessment model for saliency maps, the similar image selection method with the quality factor of saliency map, and the manifold ranking based inter-image saliency propagation method are systematically proposed to improve the quality of saliency map of the original image via the aid of similar images. Finally, the fully convolutional network based pixel-level saliency prediction method and the localized regression based region-level saliency estimation method are proposed to realize the scheme from generic to specific saliency detection, which can effectively adapt to a variety of complicated videos and fully exploit the inter-frame correlations among the frames of the test video, so as to effectively improve saliency detection performance on complicated videos. The expected research results will effectively promote the in-depth development of research on saliency detection models and facilitate the performance elevation of the related saliency-based applications.
近年来显著性检测模型的研究取得了持续进展,但在多个图像/视频数据集上的测试结果表明,对复杂图像和复杂视频,已有的各种模型的显著性检测性能严重下降。本项目将研究从三条新思路来有效提升显著性检测性能。1)系统地构建深度卷积网络来实现区域级显著性度量与象素级显著性融合的有机结合,并能充分提取多邻域多尺度的高层语义特征和低层视觉特征,以有效提升对复杂图像的显著性检测性能。2)系统地提出基于深度卷积网络的显著性图质量评估模型、结合显著性图质量的相似图像筛选方法及基于流形排序的图像间显著性传播方法,利用相似图像来有效增强原始图像的显著性图质量。3)提出基于全卷积网络的象素级显著性预测方法及基于局域化回归的区域级显著性估计方法,实现从通用到特定的显著性检测,以有效适应各类复杂视频并充分利用测试视频的帧间相关性来提升显著性检测性能。预期成果可有效推动显著性检测模型研究的深入发展及其相关应用的性能提升。

结项摘要

复杂图像(如低对比度、杂乱背景、对象极大或极小等)和复杂视频(如快速运动、对象形变及尺度变化、运动模糊等)导致各类显著性检测模型的性能严重下降。为了有效应对这一挑战,本项目组提出了面向RGB图像的基于多层级特征整合与多尺度特征融合的深度卷积网络、以及基于生成对抗网络的显著性检测模型;提出了面向RGB-D图像的深度感知卷积神经网络、信息转换网络、跨模态跨尺度加权网络、以及分层交替交互网络等一系列显著性检测模型;提出了面向全景图像的特征自适应卷积神经网络;提出了基于局域估计与时空域细化的视频显著性检测性能提升模型、以及基于深度卷积网络的视频显著性检测模型。这些模型不断提升了对复杂图像和复杂视频的显著性检测性能。.显著性检测可以利用多张图像的信息,借助图像检索,提出了基于相似图像驱动的显著性融合模型来增强显著性图质量;针对一组有共同显著对象的图像,提出了基于卷积神经网络与图像间传播、基于协同特征提取和从高到低特征融合、以及基于无监督聚类和多核增强的多种协同显著性检测模型。利用任一用户的注视点数据可以表明对其具有视觉显著性的对象,为此提出了基于深层神经网络、以及基于对象定位与边界保持的注视对象分割方法;任一用户也可以用一句话来表明图像和视频中对其而言具有显著性的感兴趣对象,为此提出了基于跨模态自注意力模型的对象分割方法。这些方法能分割出具有个性化显著性的不同对象。此外,本项目组还开展了结合显著性的图像增强、自闭症诊断、实例分割等研究工作。.本项目的研究成果对于推动显著性检测模型的研究及相关应用的发展具有重要意义。截止2022年2月,已发表SCI检索的国际学术期刊论文34篇,国内外学术会议论文16篇,其中,包括9篇国际顶级期刊和会议(IEEE TPAMI/TIP/TMM及CVPR/ECCV)论文,已总计被SCI引用314次;申请发明专利5项;培养研究生14名,其中,9名已毕业,4名获得研究生国家奖学金(1名还获得校长奖学金和宝钢优秀学生奖);并延伸1项技术开发项目。

项目成果

期刊论文数量(34)
专著数量(0)
科研奖励数量(0)
会议论文数量(16)
专利数量(5)
Depth-aware saliency detection using convolutional neural networks
使用卷积神经网络进行深度感知显着性检测
  • DOI:
    10.1016/j.jvcir.2019.03.019
  • 发表时间:
    2019
  • 期刊:
    Journal of Visual Communication and Image Representation
  • 影响因子:
    2.6
  • 作者:
    Ding Yu;Liu Zhi;Huang Mengke;Shi Ran;Wang Xiangyang
  • 通讯作者:
    Wang Xiangyang
Attentional coarse-and-fine generative adversarial networks for image inpainting
用于图像修复的注意力粗细生成对抗网络
  • DOI:
    10.1016/j.neucom.2020.03.090
  • 发表时间:
    2020
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Chen Minyu;Liu Zhi;Ye Linwei;Wang Yang
  • 通讯作者:
    Wang Yang
FANet: Features Adaptation Network for 360 degrees Omnidirectional Salient Object Detection
FANet:用于 360 度全向显着物体检测的特征适应网络
  • DOI:
    10.1109/lsp.2020.3028192
  • 发表时间:
    2020
  • 期刊:
    IEEE Signal Processing Letters
  • 影响因子:
    3.9
  • 作者:
    Huang Mengke;Liu Zhi;Li Gongyang;Zhou Xiaofei;Le Meur Olivier
  • 通讯作者:
    Le Meur Olivier
ICNet: Information conversion network for RGB-D based salient object detection
ICNet:基于 RGB-D 的显着目标检测的信息转换网络
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    IEEE Transactions on Image Processing
  • 影响因子:
    10.6
  • 作者:
    Li Gongyang;Liu Zhi;Ling Haibin
  • 通讯作者:
    Ling Haibin
Supervised learning based discrete hashing for image retrieval
基于监督学习的图像检索离散哈希
  • DOI:
    10.1016/j.patcog.2019.03.022
  • 发表时间:
    2019
  • 期刊:
    Pattern Recognition
  • 影响因子:
    8
  • 作者:
    Ma Qing;Bai Cong;Zhang Jinglin;Liu Zhi;Chen Shengyong
  • 通讯作者:
    Chen Shengyong

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

等待时间受限的并行批处理调度问题研究
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    工业工程与管理
  • 影响因子:
    --
  • 作者:
    刘志;董明
  • 通讯作者:
    董明
交互标记跟踪的三维动态数据对齐
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    潘翔;林俊勉;王学成;刘志;周小龙
  • 通讯作者:
    周小龙
黄素单核苷酸对羟自由基损伤的大
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    第二军医大学学报,26(10):1136-1139,2005
  • 影响因子:
    --
  • 作者:
    龙建纲;王学敏;高宏翔;刘志
  • 通讯作者:
    刘志
基于无人机的水肥一体化玉米出苗率估算方法与试验
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    浙江农业学报
  • 影响因子:
    --
  • 作者:
    刘志;贺正;苗芳芳;贾彪
  • 通讯作者:
    贾彪
A multiscale image segmentation algorithm based on binary partition tree
一种基于二叉划分树的多尺度图像分割算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    张兆杨;刘志;沈礼权;Zhang; Zhaoyang;Shen; Liquan;Liu; Zhi
  • 通讯作者:
    Zhi

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

刘志的其他基金

面向精神疾病诊断的注视点预测模型及其应用研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
面向无约束视频的时空显著性模型及其应用研究
  • 批准号:
    61471230
  • 批准年份:
    2014
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
基于多尺度分割的视觉显著性模型及其应用研究
  • 批准号:
    61171144
  • 批准年份:
    2011
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于视觉关注度的语义对象分割研究
  • 批准号:
    60602012
  • 批准年份:
    2006
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码