城市级大场景中快速鲁棒的相机定位方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61802361
- 项目类别:青年科学基金项目
- 资助金额:24.0万
- 负责人:
- 依托单位:
- 学科分类:F0209.计算机图形学与虚拟现实
- 结题年份:2021
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2021-12-31
- 项目参与者:余淼; 蒋方玲; 颜卓; 郭昭宏; 周娴;
- 关键词:
项目摘要
Camera localization refers to obtaining the 6-DOF camera pose relative to a 3D model, which is typically estimated from the correspondences between 2D points in the image and 3D points in the model.As the fast development of autonomous vehicles, intelligent robots and augmented reality technologies, the investigation of camera localization in city-scale outdoor scenes becomes more and more important. However, due to the enormous 3D model, viewpoint and day-night changes, weather variations etc., it is very difficult to obtain the 2D-3D correspondences both fast and accurately, and the existing methods are far from the requirements of practical usages on the robustness, the speed and accuracy. This project will focus on large scale 2D-3D matching which is the essential problem in camera localization,and aims to substantially improve its accuracy and efficiency through the development of better local features and indexing methods.The main contents are as follows: (1) improving the discriminability of local features by using convolutional neural networks to integrate the spatial context information from the entire image. (2) extracting viewpoint and illumination invariant local features by exploiting the fact that Generative Adversarial Networks can reconstruct images under some controlled factors. (3) using random decision forests to indexing the 3D points, and training the forests with supervisions in the database to improve the efficiency of 2D-3D matching.
相机定位指根据拍摄的图像获取相机相对于场景三维模型的6自由度姿态,通常可由图像二维点和模型三维点的对应关系来估计。随着自动驾驶、智能机器人、增强现实等技术的蓬勃发展,研究城市级室外大场景中的相机定位凸显出越来越重要的实际意义。然而由于模型庞大、视角差异、白-夜和天气变化等因素,快速准确地建立二维-三维对应关系难度很大,现有的定位方法在鲁棒性、速度和精度上都远未达到实际应用的要求。本项目将针对大规模二维-三维匹配这一核心问题进行研究,旨在以局部特征提取和三维点索引为突破口,实质性地提高匹配的准确性和速度,进而提升定位的鲁棒性、速度和精度。具体内容包括:(1)用卷积神经网络融合整体图像的空间上下文信息来提升局部特征的区分度(2)利用生成对抗网络可在受控条件下重构图像的特性提取具有视角和光照不变性的局部特征(3)采用随机决策森林对三维点进行有监督的索引,充分利用数据库中的监督信息提高匹配的效率。
结项摘要
相机定位指根据拍摄的图像获取相机相对于场景三维模型的6自由度姿态,由于自动驾驶、智能机器人、增强现实等技术的蓬勃发展和巨大的推广应用的前景,研究作为核心技术之一的城市级室外大场景中的相机定位有重要的意义。相机定位通常可由图像中二维点和模型三维点的对应关系来估计。本项目以提升2D-3D特征匹配的准确率和效率为目标进行研究,包括融合卷积网络中不同层级的空间上下文信息来提升增强特征的区分度,利用生成对抗式网络生成模拟图像并与原始图像的特征进行融合以提升特征的鲁棒性,合并全局特征与局部特征的提取网络降低特征提取耗时,用深度神经网络对满足几何一致性的2D-3D匹配进行筛选。实验验证融合多尺度特征以及融合生成图像的特征能够有效提升特征的区分度和鲁棒性,为学术界相关研究提供参考,全局特征与局部特征的合并能将特征提取速度提升1倍,2D-3D匹配网络能显著提升匹配准确率,从而提升相机定位的精度,有较高的实际应用价值。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Multilevel fusing paired visible light and near-infrared spectral images for face anti-spoofing
用于人脸反欺骗的多级融合成对可见光和近红外光谱图像
- DOI:10.1016/j.patrec.2019.08.008
- 发表时间:2019-12
- 期刊:Pattern Recognition Letters
- 影响因子:5.1
- 作者:Jiang Fangling;Liu Pengcheng;Zhou Xiangdong
- 通讯作者:Zhou Xiangdong
Robust Visual Place Recognition in Changing Environments Using Improved DTW
使用改进的 DTW 在不断变化的环境中进行鲁棒的视觉位置识别
- DOI:10.1142/s0218213021500044
- 发表时间:2021
- 期刊:International Journal on Artificial Intelligence Tools
- 影响因子:1.1
- 作者:Lu Feng;Chen Baifan;Guo Zhaohong;Zhou Xiangdong
- 通讯作者:Zhou Xiangdong
Face anti-spoofing with generated near-infrared images
利用生成的近红外图像进行人脸反欺骗
- DOI:10.1007/s11042-020-08952-0
- 发表时间:2020-05
- 期刊:Multimedia Tools and Applications
- 影响因子:3.6
- 作者:Jiang Fangling;Liu Pengcheng;Shao Xiaohu;Zhou Xiangdong
- 通讯作者:Zhou Xiangdong
共 3 条
- 1