基于微分几何和机器学习的立体视觉研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61402307
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    27.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2017
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2017-12-31

项目摘要

Stereo vision is one of the important issues in the field of computer vision, which is widely applied in the fields of military, industry, medicine, etc. Using the multi-view images captured by two or more multi-view cameras, stereo vision automatically reconstructs the three-dimensional geometry of scenes. However, there are many limitations in existing methods when handling textureless regions, image noises, complex surfaces or information loss. How to improve the accuracy and completeness in stereo vision has become a problem that is exigent to be solved. This project aims at the research of the application of differential geometry and machine learning in stereo vision. Differential geometric invariants and the corresponding measurement methods of consistency will be researched based on the exploration in the local differential geometry features of various smooth manifolds. Besides, we will study the mutually beneficial relationship between machine learning (e.g., object identification, object classification, illumination ambient estimation). Furthermore, we will research the methods of feature extraction and parameters estimation based on online unsupervised learning, so as to realize the self-adaptive feature extraction and parameter settings without manual intervention. On the basis of these researches, a reasonable (higher-order) Markov random filed (MRF) model will be constructed. A fast algorithm for optimizing the model will be proposed and implemented. A practical multi-camera stereo vision system with high accuracy and good completeness will be finally built, in order to dramatically save human resource and improve the efficiency in real applications.
立体视觉是计算机视觉领域中的核心问题之一,即根据多视角摄像机拍摄的图像自动恢复场景的三维几何形状,广泛应用于军事、工业、医疗等领域。但现有方法在处理弱纹理区域、图像噪声、复杂曲面、信息缺失等方面都存在局限性,使得立体视觉在精度和完整性等方面的不足成为亟待解决的问题。本课题致力于微分几何和机器学习在立体视觉中的应用研究。通过探索光滑流形局部微分几何特性,研究微分几何不变量及其一致性度量方法;研究机器学习(如目标识别、目标分类与光照环境估计)与立体匹配的互利关系;研究基于在线无监督学习的特征提取和自适应参数估计,真正实现无人工干预的自适应的特征提取和参数设定。在此基础上,构建合理的(高阶)马尔可夫随机场模型,设计并实现模型最优化问题的快速求解算法;针对多视角视频序列,搭建具备精度高、完整性好、实用性强的多摄像机立体视觉系统,在实际应用中解放人力、提高效率。

结项摘要

作为立体视觉中最重要的一步,立体匹配的精度和效率在应用中显得尤为重要。但传统立体匹配方法在处理弱纹理区域、图像噪声、复杂曲面、信息缺失等方面都存在局限性。本课题致力于解决立体视觉在精度、完整性和计算效率等方面的不足,研究取得了重要进展。通过对弱纹理、复杂曲面、信息缺失和图像噪声引起的匹配歧义、误匹配、重建场景不完整的问题进行研究,提出了一种基于材质分类的双目匹配方法;利用大量标定数据和深度学习算法,研究并提出了一种基于机器学习的图像特征提取方法,实现了自适应提取欧氏空间可分的图像局部特征;同时,我们研究并提出了一种基于机器学习的自适应平滑约束方法,结合半全局匹配算法,实现了高精度的立体匹配;通过并行计算方法,利用GPU实现立体匹配的快速求解,将计算一个视差图的时间最终控制在1秒之内,为搭建应用系统奠定了良好的基础。本课题提出的方法在公开测试库Middlebury和KITTI上均取得了良好的测试精度和较高的效率,本课题研究的成果可用于科技、文化、教育、医疗、制造等非常广泛的领域,也有望应用于若干类似的领域,如基于主动成像的立体视觉、三维配准等。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
Robust Head Pose Estimation Using a 3D Morphable Model
使用 3D 可变形模型进行稳健的头部姿势估计
  • DOI:
    10.1155/2015/678973
  • 发表时间:
    2015-03
  • 期刊:
    Mathematical Problems in Engineering
  • 影响因子:
    --
  • 作者:
    Ying Cai;Menglong Yang;Ziqiang Li
  • 通讯作者:
    Ziqiang Li
Stereo matching based on classification of materials
基于材质分类的立体匹配
  • DOI:
    10.1016/j.neucom.2016.02.049
  • 发表时间:
    2016
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Menglong Yang;Yiguang Liu;Ying Cai;Zhisheng You
  • 通讯作者:
    Zhisheng You
The Euclidean embedding learning based on convolutional neural network for stereo matching
基于卷积神经网络的欧氏嵌入学习立体匹配
  • DOI:
    10.1016/j.neucom.2017.06.007
  • 发表时间:
    2017-12-06
  • 期刊:
    NEUROCOMPUTING
  • 影响因子:
    6
  • 作者:
    Yang, Menglong;Liu, Yiguang;You, Zhisheng
  • 通讯作者:
    You, Zhisheng
Multiscale overlapping blocks binarized statistical image features descriptorwith flip-free distance for face verification in the wild
多尺度重叠块二值化统计图像特征描述符,具有免翻转距离,用于野外人脸验证
  • DOI:
    10.1007/s00521-017-2918-7
  • 发表时间:
    --
  • 期刊:
    Neural computing and applications
  • 影响因子:
    6
  • 作者:
    Tianyu Geng;Menglong Yang;Zhisheng You;Ying Cai;Feihu Huang
  • 通讯作者:
    Feihu Huang
Multiclass classification based on a deep convolutionalnetwork for head pose estimation,
基于深度卷积网络的多类分类,用于头部姿势估计,
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Frontiers of Information Technology & Electronic Engineering
  • 影响因子:
    3
  • 作者:
    Ying Cai;Menglong Yang;Jun Li
  • 通讯作者:
    Jun Li

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

絮凝调理对消化污泥的脱水性能及絮体理化特性的影响研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    环境科学学报
  • 影响因子:
    --
  • 作者:
    冯晶;王毅力;杨梦龙
  • 通讯作者:
    杨梦龙

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

杨梦龙的其他基金

机器人卫星不确定、不完整视觉信息处理理论与方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
机器人卫星不确定、不完整视觉信息处理理论与方法研究
  • 批准号:
    62271334
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
基于深度学习与视觉感知的机场场面监视技术研究
  • 批准号:
    U1933134
  • 批准年份:
    2019
  • 资助金额:
    35.0 万元
  • 项目类别:
    联合基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码