视觉特征表达的集成深度自我学习研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61862031
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    39.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Visual feature representation is the key step of computer vision, and the simple and efficient representation is the essence of visual understanding. Most hand-crafted visual features are only suitable for specific occasions and simple tasks. Although the recent deep learning technique shows promising ability to learn visual feature representations, it requires a large number of supervised samples. This project proposes to design ensemble deep self-taught learning framework, which can take advantage of self-taught learning, ensemble learning and deep learning to learn visual feature representations. Firstly, the model and training method of ensemble deep self-taught learning framework will be studied. The model and ensemble learning method will be studied, which can be trained to learn different visual cues from a large number of unlabeled low cost image and video data. Secondly, The framework based on generative adversarial networks will be designed to train ensemble deep self-taught feature representation learning model, which tries to learn element feature library of visual representation. Finally the approach to sparsely express images and videos using the visual feature representation element library will be studied, so as to implement the subsequent computer vision tasks, such as recognition and detection. The smooth development of the project will improve the theory and algorithm system of self-taught learning and deep learning, and provide an effective method for the extraction and representation of visual features.
视觉特征的表达是计算机视觉的关键步骤,简单高效的表达是视觉理解的本质。大多数人工设计的特征提取和表达方法只适合于特定场合和简单任务,近年来出现的利用深度学习实现特征的自动提取方法,虽然有学习特征表达的能力,但需要大量的监督样本。本项目提出结合自我学习、集成学习和深度学习进行视觉特征表达学习的研究。首先研究无监督集成深度学习模型,研究从大量无标签低成本图像和视频数据中集成学习不同视觉线索的模型与方法;其次研究构建生成对抗网络架构来训练自我集成深度特征表达学习模型,试图学习到视觉特征表达的基元库;最后研究利用此基元库进行图像和视频的分级稀疏表达,从而实现后续的计算机视觉任务,如分类和检测等。项目的顺利开展将完善自我学习与深度学习理论和算法体系,为视觉特征提取和表达提供一种有效的方法。

结项摘要

视觉特征的表达是计算机视觉的关键步骤,简单高效的表达是视觉理解的本质。本项目针对不同的视觉数据进行特征表达和学习的研究,利用集成学习和基于生成对抗的无监督学习方法,在不同的视觉任务上进行特征表达模型的研究。在RGB视频数据和人体骨架关键点视频数据进行特征提取和表达的研究方面,提出了协同时空注意力、多维特征激励融合、多维动态拓扑学习图卷积等一系列新颖的特征提取和表达方法,以学习到有效的时空视觉特征,并应用于人体动作识别和异常行为识别领域,获得了较大的性能提升。第二,对基于图像的数据进行特征提取和表达研究,以完成目标检测、显著性目标检测、深度估计和语义分割等基于单个图像信息的视觉任务,提出了一系列细节特征和语义特征增强和融合的方法,利用注意力指导模块集成多尺度、跨维度特征,设计交互模块以促进上下文语义信息和空间信息的交互学习,以完成不同级别的图像识别任务。另外,为了减少特征融合过程中的信息损失,提出了一种新的渐进式特征集中结构,将低级特征和高级特征逐层集成,实现多层次特征的递进融合,通过语义引导融合来缓解低层次特征在融合过程中导致的语义稀释问题,实现了更精准的特征表达。第三,集成多任务的特征表达学习研究,以利用有限的训练数据学习到通用视觉特征,同时结合生成对抗的训练学习方法,通过共享特征的学习和任务特定特征的学习,基于压缩激励和可选择权重的多任务学习网络利用可选择权重对语义分割特征和深度估计特征进行融合,学习对特定任务更具辨别性的特征。还研究了文本特征与视觉特征的融合,设计因果卷积层促进图像特征的准确描述。最后,还对特定领域,交通标志图像及光学遥感图像进行了特征表达和描述的研究,结果表明通用领域的特征学习方法需要根据领域进行微调才能获得更好的识别效果。本项目研究的实验结果表明了所提出方法的有效性,对于视觉特征表达和通用视觉任务的研究具有重要的理论意义。

项目成果

期刊论文数量(23)
专著数量(1)
科研奖励数量(0)
会议论文数量(2)
专利数量(5)
跨层多模型特征融合与因果卷积解码的图像描述
  • DOI:
    10.11834/jig.190543
  • 发表时间:
    2020
  • 期刊:
    中国图象图形学报
  • 影响因子:
    --
  • 作者:
    罗会兰;岳亮亮
  • 通讯作者:
    岳亮亮
Object Detection Method Based on Shallow Feature Fusion and Semantic Information Enhancement
基于浅层特征融合和语义信息增强的物体检测方法
  • DOI:
    10.1109/jsen.2021.3103612
  • 发表时间:
    2021-10
  • 期刊:
    IEEE Sensors Journal
  • 影响因子:
    4.3
  • 作者:
    Huilan Luo;Pei Wang;Hongkun Chen;Min Xu
  • 通讯作者:
    Min Xu
基于深度网络的图像语义分割综述
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    罗会兰;张云
  • 通讯作者:
    张云
一种生成对抗网络用于图像修复的方法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    罗会兰;敖阳;袁璞
  • 通讯作者:
    袁璞
Multi-scale Semantic Information Fusion for Object Detection
  • DOI:
    10.11999/jeit200147
  • 发表时间:
    2021-07-01
  • 期刊:
    JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
  • 影响因子:
    0.7
  • 作者:
    Chen Hongkun;Luo Huilan
  • 通讯作者:
    Luo Huilan

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种基于多级空间视觉词典集体的图像分类方法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    罗会兰;郭敏杰;孔繁胜
  • 通讯作者:
    孔繁胜
基于KL散度及多尺度融合的显著性区域检测算法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    电子与信息学报
  • 影响因子:
    --
  • 作者:
    罗会兰;万成涛;孔繁胜
  • 通讯作者:
    孔繁胜
结合目标预测位置的压缩跟踪
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中国图象图形学报
  • 影响因子:
    --
  • 作者:
    罗会兰
  • 通讯作者:
    罗会兰
融合多特征的加权分布跟踪
  • DOI:
    10.16451/j.cnki.issn1003-6059.201602005
  • 发表时间:
    2016
  • 期刊:
    模式识别与人工智能
  • 影响因子:
    --
  • 作者:
    罗会兰;单顺勇;孔繁胜
  • 通讯作者:
    孔繁胜
不依赖时空相关性的UMHexagonS改进算法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    电视技术
  • 影响因子:
    --
  • 作者:
    罗会兰
  • 通讯作者:
    罗会兰

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

罗会兰的其他基金

基础视觉功能编码的多视觉任务模型研究
  • 批准号:
    62361032
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于集成流形学习的监控视频中人体行为识别研究
  • 批准号:
    61462035
  • 批准年份:
    2014
  • 资助金额:
    46.0 万元
  • 项目类别:
    地区科学基金项目
自动聚类集成理论及其在不变性识别中的应用研究
  • 批准号:
    61105042
  • 批准年份:
    2011
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码