面向复杂图像与视频的高性能显著性检测研究
项目介绍
AI项目解读
基本信息
- 批准号:61771301
- 项目类别:面上项目
- 资助金额:62.0万
- 负责人:
- 依托单位:
- 学科分类:F0117.多媒体信息处理
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:孙广玲; 李凯; 周晓飞; 杜欢; 黄梦珂; 任静茹; 吴莉珊; 李恭杨; 张彤;
- 关键词:
项目摘要
Recent years have witnessed the continuous development of research on saliency detection models. However, the test results on multiple image/video datasets show that the performances of the existing state-of-the-art saliency detection models significantly degrade on complicated images and complicated videos. This project will investigate three novel solutions to effectively elevate saliency detection performance. First, the deep convolutional networks are systematically constructed to realize the effective integration of region-level saliency measurement and pixel-level saliency fusion, and high-level semantic features and low-level visual features are sufficiently extracted in a multi-context multi-scale way, so as to effectively elevate saliency detection performance on complicated images. Then, the deep convolutional network based quality assessment model for saliency maps, the similar image selection method with the quality factor of saliency map, and the manifold ranking based inter-image saliency propagation method are systematically proposed to improve the quality of saliency map of the original image via the aid of similar images. Finally, the fully convolutional network based pixel-level saliency prediction method and the localized regression based region-level saliency estimation method are proposed to realize the scheme from generic to specific saliency detection, which can effectively adapt to a variety of complicated videos and fully exploit the inter-frame correlations among the frames of the test video, so as to effectively improve saliency detection performance on complicated videos. The expected research results will effectively promote the in-depth development of research on saliency detection models and facilitate the performance elevation of the related saliency-based applications.
近年来显著性检测模型的研究取得了持续进展,但在多个图像/视频数据集上的测试结果表明,对复杂图像和复杂视频,已有的各种模型的显著性检测性能严重下降。本项目将研究从三条新思路来有效提升显著性检测性能。1)系统地构建深度卷积网络来实现区域级显著性度量与象素级显著性融合的有机结合,并能充分提取多邻域多尺度的高层语义特征和低层视觉特征,以有效提升对复杂图像的显著性检测性能。2)系统地提出基于深度卷积网络的显著性图质量评估模型、结合显著性图质量的相似图像筛选方法及基于流形排序的图像间显著性传播方法,利用相似图像来有效增强原始图像的显著性图质量。3)提出基于全卷积网络的象素级显著性预测方法及基于局域化回归的区域级显著性估计方法,实现从通用到特定的显著性检测,以有效适应各类复杂视频并充分利用测试视频的帧间相关性来提升显著性检测性能。预期成果可有效推动显著性检测模型研究的深入发展及其相关应用的性能提升。
结项摘要
复杂图像(如低对比度、杂乱背景、对象极大或极小等)和复杂视频(如快速运动、对象形变及尺度变化、运动模糊等)导致各类显著性检测模型的性能严重下降。为了有效应对这一挑战,本项目组提出了面向RGB图像的基于多层级特征整合与多尺度特征融合的深度卷积网络、以及基于生成对抗网络的显著性检测模型;提出了面向RGB-D图像的深度感知卷积神经网络、信息转换网络、跨模态跨尺度加权网络、以及分层交替交互网络等一系列显著性检测模型;提出了面向全景图像的特征自适应卷积神经网络;提出了基于局域估计与时空域细化的视频显著性检测性能提升模型、以及基于深度卷积网络的视频显著性检测模型。这些模型不断提升了对复杂图像和复杂视频的显著性检测性能。.显著性检测可以利用多张图像的信息,借助图像检索,提出了基于相似图像驱动的显著性融合模型来增强显著性图质量;针对一组有共同显著对象的图像,提出了基于卷积神经网络与图像间传播、基于协同特征提取和从高到低特征融合、以及基于无监督聚类和多核增强的多种协同显著性检测模型。利用任一用户的注视点数据可以表明对其具有视觉显著性的对象,为此提出了基于深层神经网络、以及基于对象定位与边界保持的注视对象分割方法;任一用户也可以用一句话来表明图像和视频中对其而言具有显著性的感兴趣对象,为此提出了基于跨模态自注意力模型的对象分割方法。这些方法能分割出具有个性化显著性的不同对象。此外,本项目组还开展了结合显著性的图像增强、自闭症诊断、实例分割等研究工作。.本项目的研究成果对于推动显著性检测模型的研究及相关应用的发展具有重要意义。截止2022年2月,已发表SCI检索的国际学术期刊论文34篇,国内外学术会议论文16篇,其中,包括9篇国际顶级期刊和会议(IEEE TPAMI/TIP/TMM及CVPR/ECCV)论文,已总计被SCI引用314次;申请发明专利5项;培养研究生14名,其中,9名已毕业,4名获得研究生国家奖学金(1名还获得校长奖学金和宝钢优秀学生奖);并延伸1项技术开发项目。
项目成果
期刊论文数量(34)
专著数量(0)
科研奖励数量(0)
会议论文数量(16)
专利数量(5)
Depth-aware saliency detection using convolutional neural networks
使用卷积神经网络进行深度感知显着性检测
- DOI:10.1016/j.jvcir.2019.03.019
- 发表时间:2019
- 期刊:Journal of Visual Communication and Image Representation
- 影响因子:2.6
- 作者:Ding Yu;Liu Zhi;Huang Mengke;Shi Ran;Wang Xiangyang
- 通讯作者:Wang Xiangyang
Attentional coarse-and-fine generative adversarial networks for image inpainting
用于图像修复的注意力粗细生成对抗网络
- DOI:10.1016/j.neucom.2020.03.090
- 发表时间:2020
- 期刊:Neurocomputing
- 影响因子:6
- 作者:Chen Minyu;Liu Zhi;Ye Linwei;Wang Yang
- 通讯作者:Wang Yang
FANet: Features Adaptation Network for 360 degrees Omnidirectional Salient Object Detection
FANet:用于 360 度全向显着物体检测的特征适应网络
- DOI:10.1109/lsp.2020.3028192
- 发表时间:2020
- 期刊:IEEE Signal Processing Letters
- 影响因子:3.9
- 作者:Huang Mengke;Liu Zhi;Li Gongyang;Zhou Xiaofei;Le Meur Olivier
- 通讯作者:Le Meur Olivier
ICNet: Information conversion network for RGB-D based salient object detection
ICNet:基于 RGB-D 的显着目标检测的信息转换网络
- DOI:--
- 发表时间:2020
- 期刊:IEEE Transactions on Image Processing
- 影响因子:10.6
- 作者:Li Gongyang;Liu Zhi;Ling Haibin
- 通讯作者:Ling Haibin
Supervised learning based discrete hashing for image retrieval
基于监督学习的图像检索离散哈希
- DOI:10.1016/j.patcog.2019.03.022
- 发表时间:2019
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Ma Qing;Bai Cong;Zhang Jinglin;Liu Zhi;Chen Shengyong
- 通讯作者:Chen Shengyong
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
等待时间受限的并行批处理调度问题研究
- DOI:--
- 发表时间:2014
- 期刊:工业工程与管理
- 影响因子:--
- 作者:刘志;董明
- 通讯作者:董明
交互标记跟踪的三维动态数据对齐
- DOI:--
- 发表时间:2017
- 期刊:计算机科学
- 影响因子:--
- 作者:潘翔;林俊勉;王学成;刘志;周小龙
- 通讯作者:周小龙
黄素单核苷酸对羟自由基损伤的大
- DOI:--
- 发表时间:--
- 期刊:第二军医大学学报,26(10):1136-1139,2005
- 影响因子:--
- 作者:龙建纲;王学敏;高宏翔;刘志
- 通讯作者:刘志
基于无人机的水肥一体化玉米出苗率估算方法与试验
- DOI:--
- 发表时间:2019
- 期刊:浙江农业学报
- 影响因子:--
- 作者:刘志;贺正;苗芳芳;贾彪
- 通讯作者:贾彪
A multiscale image segmentation algorithm based on binary partition tree
一种基于二叉划分树的多尺度图像分割算法
- DOI:--
- 发表时间:--
- 期刊:计算机辅助设计与图形学学报
- 影响因子:--
- 作者:张兆杨;刘志;沈礼权;Zhang; Zhaoyang;Shen; Liquan;Liu; Zhi
- 通讯作者:Zhi
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘志的其他基金
面向精神疾病诊断的注视点预测模型及其应用研究
- 批准号:
- 批准年份:2021
- 资助金额:57 万元
- 项目类别:面上项目
面向无约束视频的时空显著性模型及其应用研究
- 批准号:61471230
- 批准年份:2014
- 资助金额:80.0 万元
- 项目类别:面上项目
基于多尺度分割的视觉显著性模型及其应用研究
- 批准号:61171144
- 批准年份:2011
- 资助金额:60.0 万元
- 项目类别:面上项目
基于视觉关注度的语义对象分割研究
- 批准号:60602012
- 批准年份:2006
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}