基于注意力模型的跨场景行人检测算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61902204
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0210.计算机图像视频处理与多媒体技术
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
Cross-scene pedestrian detection has struggle with the presence of scale differences, non-rigid deformations, partial occlusion caused by material objects and background interference. The difficulties of cross-scene pedestrian detection lies in essential representation of essential features, construction of robust classification models, precise localization of spatial locations, and the ability to generalization. To solve the aforementioned challenges, we propose the following novel solutions. For distinct visual appearances of disparate spatial scales, we propose a multi-scale CNN feature selection and fusion algorithm based on attention model to solve the cross-scale difference of pedestrians in global holistic features and local regional features. To solve the problem of semantic alignment errors caused by partial occlusion and local aliasing, we propose a semantic feature alignment method by weak supervision according to the characteristics of pedestrian topology. And a pedestrian classification algorithm will be proposed to improve the ability of pedestrian classification discrimination and anti-occlusion based on semantic feature self-attention model. To alleviate localization of spatial locations which caused by lack of position sensitivity to high-level CNN features, we propose a pedestrian localization algorithm to improve positioning accuracy based on context attention model by aggregating spatio-temporal context features in video. The research outputs will be applied for video surveillance systems and advanced driver assistance systems in public safety settings.
在跨场景行人检测中由于行人不同尺度差异、自身的非刚体形变以及其他物体的部分遮挡和背景干扰问题,导致行人检测在本质表观特征表示、分类模型构建、空间位置精确定位及跨场景泛化能力等方面遇到极大的挑战。为此,本项目拟提出如下创新性的解决方案:针对行人在不同尺度上类内特征分布不一致的问题,根据不同尺度行人在全局整体特征和局部细节特征上的差异性,研究一种基于注意力模型的多尺度CNN特征选择及融合算法。针对受遮挡行人目标所引发的外观模式差异、局部混叠等语义对准误差问题,根据行人拓扑结构特点,研究基于弱监督的语义特征对齐方法和基于语义特征自注意力模型的行人分类算法。针对具有分类平移不变性的高层CNN特征缺乏位置敏感性导致行人定位不精确的问题,根据视频图像时空间上下文辅助信息,研究一种基于上下文注意力模型的行人定位算法。最终项目的研究成果将用于公共安全场所内的视频监控系统和高级驾驶辅助系统。
结项摘要
智能视频监控是当前计算机视觉和多媒体分析领域内的热点问题,而行人对象的智能分析技术是智能视频监控系统中的核心关键技术之一。然而,在实际监控场景中,由于场景本身的复杂性和多样性以及监控距离、拍摄视角、遮挡问题等因素的干扰,不可避免的导致视频中目标在特征提取、建模、学习与推理等方面都遇到很大的挑战,严重的影响了监控视频中行人检测、跟踪与再识别的性能。因此,对行人目标开展智能分析的研究是视频监控领域中一个非常重要的研究课题,具有广泛的应用价值和研究意义。本课题主要围绕以下三个方面开展研究:.(1)根据不同卷积特征层对不同空间尺度行人目标有效特征表示的差异性,设计了基于尺度感知的多任务损失函数在多路径行人候选区域推荐网络上根据行人图像的分辨率来动态自适应的感知相应卷积特征层上的有效特征,以提高行人目标的特征表达能力。.(2)基于孪生网络结构的目标跟踪算法中,由于其分类和回归任务共享的网络结构限制了跟踪器获得更鲁棒和准确预测的能力。 鉴于识别目标类别需要平移不变特征,而位置敏感信息有助于目标边界框回归任务,设计了一种差异化的跟踪头网络,其通过利用特征响应模块 (FRM) 和差异化兄弟头 (DSH) 减轻分类和回归任务域之间的错位。.(3)源域与目标域行人图像的表观特征差异性是导致行人重识别模型泛化能力下降的最关键因素。针对这一问题,在带标签的源域和无标签的目标域采用无监督学习方式对齐行人部件,并设计了跨域不变性损失函数学习跨域行人局部语义不变性特征模型。进一步,提出了基于多标签协同学习的跨域行人重识别方法,利用语义解析模型构造了基于语义对齐的多标签数据表示,并利用协同学习平均模型减少跨域场景下噪声硬标签的干扰。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
Dual Attentional Siamese Network for Visual Tracking
用于视觉跟踪的双注意连体网络
- DOI:10.1016/j.displa.2022.102205
- 发表时间:2022-04
- 期刊:Displays
- 影响因子:4.3
- 作者:Xiaowei Zhang;Jianwei Ma;Hong Liu;Hai-Miao Hu;Peng Yang
- 通讯作者:Peng Yang
Deformable Pyramid R-CNN for 3D object detection (ChinaMM2022)
用于 3D 物体检测的可变形金字塔 R-CNN (ChinaMM2022)
- DOI:10.1016/j.displa.2022.102322
- 发表时间:2022-10
- 期刊:Displays
- 影响因子:4.3
- 作者:Yingjie Hou;Xiaowei Zhang
- 通讯作者:Xiaowei Zhang
基于跨尺度特征聚合网络的多尺度行人检测
- DOI:10.13700/j.bh.1001-5965.2020.0069
- 发表时间:2020
- 期刊:北京航空航天大学学报
- 影响因子:--
- 作者:曹帅;张晓伟;马健伟
- 通讯作者:马健伟
基于局部语义特征不变性的跨域行人重识别
- DOI:10.13700/j.bh.1001-5965.2020.0072
- 发表时间:2020
- 期刊:北京航空航天大学学报
- 影响因子:--
- 作者:张晓伟;吕明强;李慧
- 通讯作者:李慧
Scale-Aware Hierarchical Detection Network for Pedestrian Detection
用于行人检测的规模感知分层检测网络
- DOI:10.1109/access.2020.2995321
- 发表时间:2020
- 期刊:IEEE ACCESS
- 影响因子:3.9
- 作者:Zhang Xiaowei;Cao Shuai;Chen Chenglizhao
- 通讯作者:Chen Chenglizhao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
对甲基苯甲酸镧作为PVC热稳定剂的研究
- DOI:10.19491/j.issn.1001-9278.2019.07.013
- 发表时间:2019
- 期刊:中国塑料
- 影响因子:--
- 作者:柳召刚;冯佳萌;李梅;胡艳宏;王觅堂;张晓伟
- 通讯作者:张晓伟
二次回归正交设计在氟碳铈矿浸出中的应用
- DOI:--
- 发表时间:2013
- 期刊:湿法冶金
- 影响因子:--
- 作者:柳召刚;李梅;张晓伟;刘佳
- 通讯作者:刘佳
核苷二磷酸激酶A的定点突变及C4S突变体的制备和活性研究
- DOI:--
- 发表时间:--
- 期刊:中国生物工程杂志
- 影响因子:--
- 作者:熊盛;张晓伟;黄增委;王一飞;郭朝万;陈蕴如;钱垂文
- 通讯作者:钱垂文
Synchronous-asynchronous encounter probability of rich-poor runoff based on copula function
基于Copula函数的富贫径流同异步相遇概率
- DOI:--
- 发表时间:--
- 期刊:Sichuan Daxue Xuebao (Gongcheng Kexue Ban)
- 影响因子:--
- 作者:沈冰;张晓伟;莫淑红
- 通讯作者:莫淑红
三种拟合评价法计算水文频率的比较
- DOI:--
- 发表时间:2015
- 期刊:南水北调与水利科技
- 影响因子:--
- 作者:孟彩侠;王平义;张晓伟;喻涛
- 通讯作者:喻涛
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}