复杂动态场景空时稀疏尺度广义目标分割方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61761024
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    37.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0116.图像信息处理
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Segmentation of complex dynamic scenes is a fundamental problem in image processing. Convolutional neural networks (CNNs) provide a powerful tool for segmentation. Existing methods usually exploit original data with large amount of spatio-temporal reduance for class-specific detection lacking effective saptio-temporal constraints, which lead to inefficient model training, invalid segmentation of class-agnostic objects and discontinuity of detail information. The key problem for high-performance segmentation is to explore a new representation mechanism of spatio-temporal sparse scenes and segmentation of generic objects with both spatial and temporal coherence constraints. We propose to segment generic objects in complex dynamic scenes at sparse spatio-temporal scales by building a novel cascade convolutional network with spatial and temporal coherence constraints. The cascade convolutional network is composed of a position detection and a segmentation sub-network. We explore a representation mechanism of spatio-temporal sparse scenes by training the cascade network using a specific loss function. To investigate online update strategy of object locations and build a spatio-temporal conditional random field (CRF) to impose spatial and temporal coherence constraints on activation feature maps, through inference of the CRF to obtain generic object segmentation. Carrying out segmentation experiments to verify the proposed algorithm on motion segmentation benchmarks and images acquired on an industrial robot vision platform. The scientific objective is to deal with the challenging problem of large displecement object segmentation in complex dynamic scenes with low resolution, and explore the representation mechanism of spatio-temporal sparse scenes for the purpose of high-performance segmentation of generic objects.
复杂动态场景分割是图像处理领域的一个重要研究课题,卷积神经网络为分割提供了有力的工具,但现有算法存在数据空时冗余过大、检测类别语义相关、缺乏有效空时约束等局限,导致模型训练效率较低、类无关目标分割失效、细节连贯性不足等缺陷。探索空时稀疏尺度场景数据表征机制和空时一致的广义目标分割算法,是实现高性能分割的关键。本项目以建立空时一致级联卷积网络模型为基础对空时稀疏复杂动态场景广义目标分割方法进行研究。建立由位置检测和分割子网构成的级联卷积网络,定义损失代价函数进行级联网络训练,探索空时稀疏场景广义目标表征机制;研究目标位置在线更新策略并建立空时条件随机场模型,施加激活特征映射空时一致性约束,推理实现广义目标分割;采用运动分割标准库和工业机器人视觉平台开展分割实验,验证本项目算法的性能。本项目旨在解决复杂动态场景低分辨大位移目标分割难题,为空时稀疏场景广义目标表征机制和高性能分割提供理论依据。

结项摘要

本研究针对现有复杂动态场景分割算法存在数据空时冗余过大、检测类别语义相关、缺乏有效空时约束等局限,研究对场景空时稀疏尺度特征表征学习能力及有效多尺度空时信息融合处理机制,以实现复杂动态场景广义目标高性能分割。其主要内容包括构建动态场景分割级联卷积神经网络模型;定义损失函数并进行级联卷积网络训练;建立条件随机场模型施加卷积特征映射空时一致性约束;激活特征响应位置在线更新与动态场景广义目标后验概率推理;复杂动态场景广义目标分割算法有效性验证。研究过程中构建空时一致级联卷积神经网络分割模型,促进基于语义排序属性对类无关对象的评估。定义损失代价目标函数表征每帧图像激活特征响应与真实分割之间的差异。损失代价目标函数最小化训练级联卷积网络参数,获得空时稀疏动态场景目标和背景特征有效表征。根据当前预测位置信息与空时显著位置信息之间的误差,在线更新具有较高评分的目标卷积特征映射位置信息,实现对目标激活特征响应位置的在线更新。制定空时一致条件随机场能量函数的变分优化策略,推理目标后验概率像素级分布,得到最终的复杂动态场景广义目标分割计算结果,建立动态场景广义目标后验概率像素级估计策略。采用高动态场景图像分割标准库弗里堡-伯克利运动分割(FBMS)数据集开展分割实验,视频对象分割结果与三种先进的分割方法进行对比实验,在ROC和PRC方面对FBMS训练集和测试集定性分割性能进行比较,提供的定性结果导致一致性评估,与AUC和AP方面的定量分数测量结果吻合良好。本项目在具有复杂动态范围工业机器人视觉计算平台无约束场景中进行分割实验。在随机初始化条件下,本项目提出方法和Deeplab方法在验证集的像素精度和Jaccard指数方面带来了额外平均4.1432%和4.4744%的改善,而比较本项目提出方法和Deeplab方法在测试集像素精度和Jaccard方面带来了额外的平均29.9465%和29.8712%的改进。本项目提出的同时处理类相关和类无关运动目标的分割方法,解决了具有较小数据冗余的复杂动态场景空时稀疏尺度中出现低分辨大位移广义运动目标分割难题,为复杂动态场景下目标鲁棒分割及其在制造领域的推广应用提供理论依据和高性能算法。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(28)
基于非对称混洗卷积神经网络的苹果叶部病害分割
  • DOI:
    10.6041/j.issn.1000-1298.2021.08.022
  • 发表时间:
    2021
  • 期刊:
    农业机械学报
  • 影响因子:
    --
  • 作者:
    何自芬;黄俊璇;刘强;张印辉
  • 通讯作者:
    张印辉
基于模型压缩与感受野增强的下茧实时检测
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    纺 织 学 报 Journal of Textile Research
  • 影响因子:
    --
  • 作者:
    张印辉;杨宏宽;刘强;何自芬
  • 通讯作者:
    何自芬
基于多尺度小波变换和结构化森林的表面裂纹分割
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    光 学 学 报 ACTAOPTICASINICA
  • 影响因子:
    --
  • 作者:
    王森;伍星;张印辉;陈庆
  • 通讯作者:
    陈庆
多尺度特征融合工件目标语义分割
  • DOI:
    10.11834/jig.190218
  • 发表时间:
    2020
  • 期刊:
    中国图象图形学报
  • 影响因子:
    --
  • 作者:
    和超;张印辉;何自芬
  • 通讯作者:
    何自芬
基于联合模型匹配的齿轮视觉检测方法
  • DOI:
    10.3778/j.issn.1002-8331.1708-0303
  • 发表时间:
    2018
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    田敏;张印辉;何自芬;王森
  • 通讯作者:
    王森

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于火焰图像特征与GRNN的转炉吹炼状态识别
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    刘辉;张云生;张印辉;何自芬
  • 通讯作者:
    何自芬
基于图像处理的烟标烫金质量检测技术研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    包装工程
  • 影响因子:
    --
  • 作者:
    何自芬;张印辉
  • 通讯作者:
    张印辉
均匀空间色差度量的矢量形态学图像处理
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国图象图形学报
  • 影响因子:
    --
  • 作者:
    刘辉;张云生;张印辉;何自芬
  • 通讯作者:
    何自芬
基于图像分割和加权最小二乘法的数字半色调技术
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    光学学报
  • 影响因子:
    --
  • 作者:
    何自芬;詹肇麟;张印辉
  • 通讯作者:
    张印辉
尺度相关系数融合数字半色调算法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    光学学报
  • 影响因子:
    --
  • 作者:
    何自芬;张印辉;詹肇麟
  • 通讯作者:
    詹肇麟

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

何自芬的其他基金

空时稀疏场景高阶多项式时变记忆投影弱监督实例分割
  • 批准号:
    62171206
  • 批准年份:
    2021
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
基于尺度相关感知误差测度近似全局优化的数字图像半色调方法研究
  • 批准号:
    61302173
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码