面向空基监视的时空多变场景下表征学习研究
项目介绍
AI项目解读
基本信息
- 批准号:61871016
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0116.图像信息处理
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:余孟洋; 李岩; 胡宇韬; 张安然; 肖泽昊; 岳蕾; 沈佳怡; 刘旭辉;
- 关键词:
项目摘要
Air-based visual surveillance has recently drawn increasing attention due to its potential applications. It is more challenging compared to traditional computer vision task. The air base demonstrates great spatial-temporal variabilities and with this restriction, the imaging data is typically in low quality and objects of interest are usually too small and has no distinct appearance. Therefore, it demands more advanced representation learning methods, which however are not readily available in existing computer vision tasks. In this project, we introduce attention mechanism in the neural network framework and develop new representation models and learning algorithms. Firstly, we construct a spatial attention network to achieve translation invariant and deep semantic ensemble representations. Second, we establish a temporal attention network to achieve selective representation and soft-attentive aggregation of frames. Lastly, we build a spatial-temporal attention network and kernel approximation network to achieve joint spatial-temporal fusion representation. The algorithms will be validated on representative tasks from air based visual surveillance. Our study will fill several technique gaps in visual surveillance and our algorithms can also be generalized to related visual tasks.
空基监视由于其巨大的应用价值,日益受到广泛关注。与常规的计算机视觉任务相比,空基视觉监视具有特殊挑战性。空基监视场景时空多变,受平台特殊性的限制,影像数据质量较差,感兴趣目标较小,表观特征极其不明显。因而,对视觉表征算法提出的更高要求,现有的面向常规视觉任务的表征算法不能满足需求。本课题针对上述挑战,引入人类视觉注意力机制,结合神经网络端对端的学习框架,提出新的表征模型和学习算法。具体地,首先构建空间注意力机制网络,实现匹配平移不变和深层语义场景图像集成表征;再次,构建异步时序注意力机制网络,实现动态场景时序帧图像的选择稀疏表征和柔性汇聚表征;最后,构建时空联合注意力机制网络和核近似融合网络,实现动态场景时空信息联合表征。算法将在空基监视典型的任务进行实验验证。本课题研究不仅能够填补空基监视时空多变场景下表征学习的研究空白,而且,算法成果能够泛化并应用到相关任务,促进视觉表征学习领域发展。
结项摘要
针对空基监视场景时空多变,影像数据质量较差,感兴趣目标较小,表观特征极其不明显的问题,从多个角度提出解决途径。在注意力机制架构方面,提出利可以充分利用语义和位置信息的注意力信息混合网络;提出基于注意力的时空金字塔网络架构, 通过提取和聚集最具表征性和辨别性的特征来建立动态场景的有效表示;提出基于注意力的多尺度聚合网络,在不同尺度上将注意力机制、卷积模块和最大池化模化、聚合模块联合优化;通过引入了分散化的图形注意力机制,激活对象上的更多像素,提出分散注意网络,实现更加鲁棒的注意力机制;提出一种用于细粒度视觉分类的注意核编码网络。在深度模型表征学习方面,提出基于高斯滤波的深度模型;提出深度表示和运动信息融合的混合网络模型;基于余弦激活函数对网络架构的影响,提出多视角流网络融合表示,提出异构输出回归网络等。针对样本标注不足的情况,即小样本学习任务方面,引入变分贝叶斯推理学习框架,提出元变分随机特征方法以及变分语义记忆单元方法等。项目发表SCI论文总计10篇,包含机器学习和计算机视觉顶级会议在内的会议文章12篇,申请发明专利6项,出版专著1部。
项目成果
期刊论文数量(9)
专著数量(1)
科研奖励数量(0)
会议论文数量(11)
专利数量(6)
Spherical Zero-Shot Learning
球形零样本学习
- DOI:10.1109/tcsvt.2021.3067067
- 发表时间:2022-02
- 期刊:IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY
- 影响因子:8.4
- 作者:Jiayi Shen;Zehao Xiao;Xiantong Zhen;Lei Zhang
- 通讯作者:Lei Zhang
Attentional Information Fusion Networks for Cross-Scene Power Line Detection
用于跨场景电力线检测的注意力信息融合网络
- DOI:10.1109/lgrs.2019.2903217
- 发表时间:2019-10-01
- 期刊:IEEE GEOSCIENCE AND REMOTE SENSING LETTERS
- 影响因子:4.8
- 作者:Li, Yan;Xiao, Zehao;Cao, Xianbin
- 通讯作者:Cao, Xianbin
Conditional Variational Image Deraining
条件变分图像去雨
- DOI:10.1109/tip.2020.2990606
- 发表时间:2020-04
- 期刊:IEEE TRANSACTIONS ON IMAGE PROCESSING
- 影响因子:10.6
- 作者:Yingjun Du;Jun Xu;Xiantong Zhen;Ming-Ming Cheng;Ling Shao
- 通讯作者:Ling Shao
Cosine Activation in Compact Network (CACN): Application to Scene Classification
紧凑网络中的余弦激活(CACN):在场景分类中的应用
- DOI:10.1109/access.2019.2926839
- 发表时间:2019
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Lei Zhang;Xin Li;Zhiping Jian;Wei Zhang;Xiantong Zhen
- 通讯作者:Xiantong Zhen
Gaussian Transfer Convolutional Neural Networks
高斯转移卷积神经网络
- DOI:10.1109/tetci.2018.2881225
- 发表时间:2019-10-01
- 期刊:IEEE TRANSACTIONS ON EMERGING TOPICS IN COMPUTATIONAL INTELLIGENCE
- 影响因子:5.3
- 作者:Wang, Hongren;Li, Ce;Zhang, Baochang
- 通讯作者:Zhang, Baochang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
Learning Match Kernels on Grassmann Manifolds for Action Recognition
学习 Grassmann 流形上的匹配内核以进行动作识别
- DOI:10.1109/tip.2018.2866688
- 发表时间:2019-01
- 期刊:IEEE Transaction on Image Processing
- 影响因子:--
- 作者:张磊;甄先通;Ling Shao;Jingkuan. Song
- 通讯作者:Jingkuan. Song
Multi-Target Regression via Robust Low-Rank Learning
通过鲁棒低秩学习进行多目标回归
- DOI:10.1109/tpami.2017.2688363
- 发表时间:2018-02
- 期刊:IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
- 影响因子:23.6
- 作者:甄先通
- 通讯作者:甄先通
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
甄先通的其他基金
基于贝叶斯不确定性的分布外泛化方法研究
- 批准号:
- 批准年份:2021
- 资助金额:57 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}