多尺度特征计算加速算法与同类行为视角无关描述符挖掘方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61472196
  • 项目类别:
    面上项目
  • 资助金额:
    81.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

View-dependent videos for one same action are quite visually different at multi-sacle changes and view-point variations, which are crucial factors for action recognitions. Calculations of multiscale features from video images are usually based on finer scale pyramid strategy, which is to figure out low-level features respectively at each scale leavel. This scheme is of redundent information but worse of reatime, which becomes urgent bottleneck in applications. A new fast scale pyramid strategy based on feature forecast algorithm is proposed, which can speed up low-level feature calculations and solve real-time problem fundamentally. Secondly to overcome action recognition inaccuracy problem caused by view-point variations, Recurrence Plot method primarily for none linear dynamics system is adopted to construct phase space image, which is equivalent as system original phase space and can be exploited to mine recurrent similarities from view dependent videos alone its diagonal, where chaotic recurrent texture features are well developed. Traditional clustering method cannot solve none convex-distributed data sets, further more its number of clustering types have to be pre-decided that will destroy data original structure, a muti-agent evolutionary clustering algorithm is proposed which is sensitive to data distribution shape, so that the true action pattern structure can be explicitly discovered from the above various view-dependent video recurrent features. Finally one action model can be established based on bag of words. This study provides a theoretical basis for the practical application of action analysis and recognition in computer vision.
不同视图的同类行为对象具有尺度变化和视角各异的鲜明区别,是影响行为识别的关键因素。视频中的多尺度特征计算,通常采用精细的尺度金字塔分层策略分别计算每层的底层特征。但该方案提取的信息冗余而实时性不足,已成为实际应用亟待解决的瓶颈。本课题首先提出基于特征预测算法的金字塔分层策略,加速多尺度特征的计算,从根本上解决实时性不足问题。其次针对同类行为不同视角带来的行为识别精度问题,拟采用非线性动力学系统的递归图分析方法,通过建立与系统原相空间等价的相空间递归图,根据递归图对角线方向具有发育较好的混动递归线条纹理的属性,挖掘其递归相似性。然后针对传统聚类方法中须预置类别个数以及不能有效聚类非凸集数据集合等缺点,拟采用基于流形相似度计算的多智能体进化聚类算法,对挖掘出的行为递归相似性数据集进行结构性分析。最后,基于关键词词袋策略建立同类行为模型。本研究为计算机视觉中行为分析和识别的实际应用提供理论依据。

结项摘要

该项目主要针对行为识别中的两个关键问题研究,即多尺度时空特征的快速计算以及角度无关性识别。针对第一个问题,传统算法是采用精细的尺度金字塔分层策略分别计算每层的底层特征,但该方案提取的信息冗余而实时性不足,本项目提出基于预测的多尺度时空特征计算方法。首先,根据 Dollár 等人研究出的不同尺度之间的底层特征存在一个指数系数关系原理,通过实验统计计算出 DoH 特征的指数系数值;然后,通过时间尺度之间的递归性与二维 DoH 特征的尺度关系式,进一步推导出在三维空间中时空特征点的预测表达式,减少了金字塔的分层计算;通过与传统算法对比,在保证具有 80%以上准确性的条件下,随着时空尺度分层的不断增加运算时间的减低优势更加明显。.针对角度无关性识别展开了三种研究方法,第一种研究方案是利用时空特征点为底层特征,以递归图分析法挖掘不同视角间的共性来建立描述符,实现视角无关行识别,其实验结果是基于IXMAS数据库中的走路、坐下、踢腿三个动作的不同视角下的35段视频下完成的,识别率均在80%以上。第二种方法是基于骨架数据利用注意力模型实现的,该模型由特定视角子网和公共子网串联组成,首先通过特定视角子网学习每个视角序列的判别性特征, 同时利用空域注意力和时域注意力模块分别重点关注关键关节点和关键帧; 然后特定视角子网的输出特征作为公共子网的输入, 通过公共子网进一步学习角度无关性特征; 最后输出行为分类结果。 该模型在目前最大的骨架数据集 NTU 数据集上识别准确率为 76.3%。第三种方法是基于IXMAS和WVU数据集上的深度学习网络下的研究,该算法的特点是对CNN和LSTM得到的特征集利用K-SVD进行稀疏表示,得到每个行为在不同视角下潜藏在的共同特征。将得到的共同特征作为该行为的描述符,送入Softmax分类器进行分类识别;该算法在IXMAS和WVU数据集中的平均识别率分别为89.22%和91.4%。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(4)
基于可变形部件模型的粒子滤波快速行人检测与跟踪
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机应用与软件
  • 影响因子:
    --
  • 作者:
    王传旭;郝艳婷
  • 通讯作者:
    郝艳婷
基于底层特征建模的行为识别算法优化
  • DOI:
    10.1016/j.iot.2023.100776
  • 发表时间:
    2018
  • 期刊:
    科 学 技 术 与 工 程
  • 影响因子:
    --
  • 作者:
    刘云;杨建滨;王传旭
  • 通讯作者:
    王传旭
Tracking Algorithm of Multiple Pedestrians Based on Particle Filters in Video Sequences
视频序列中基于粒子滤波器的多个行人跟踪算法
  • DOI:
    10.1155/2016/8163878
  • 发表时间:
    2016
  • 期刊:
    Computational Intelligence and Neuroscience
  • 影响因子:
    --
  • 作者:
    Li H;Liu Y;Wang C;Zhang S;Cui X
  • 通讯作者:
    Cui X
基于RGB-D与深度学习的行为识别算法研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    刘云;张永;王传旭
  • 通讯作者:
    王传旭
基于时间序列无关性的视角无关行为识别
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机与数字工程
  • 影响因子:
    --
  • 作者:
    王传旭;邓海刚
  • 通讯作者:
    邓海刚

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

关于国防科技工业发展创新型产业
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    国防技术基础,2006,(9):4-6
  • 影响因子:
    --
  • 作者:
    刘云
  • 通讯作者:
    刘云
氧化孔径对高功率垂直腔面发射激光器温升的影响
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    中国激光
  • 影响因子:
    --
  • 作者:
    张星;刘云;王立军;Liu Di1;2 Ning Yongqiang1 Qin Li1 Zhang Jinlong1;2 Zhang Xing
  • 通讯作者:
    2 Zhang Xing
紫杉醇对犬乳腺肿瘤细胞生长的抑制作用
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国兽医杂志
  • 影响因子:
    --
  • 作者:
    李华涛;任晓丽;向毅;金鹏;马兴乾;张荣蓉;刘云
  • 通讯作者:
    刘云
RFP框架下区域专利增长的差异性特征分析
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    科学学研究
  • 影响因子:
    --
  • 作者:
    刘云;谭龙;张振伟
  • 通讯作者:
    张振伟
一种传感器网络访问控制机制
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    西安电子科技大学学报
  • 影响因子:
    --
  • 作者:
    刘云;裴庆琪
  • 通讯作者:
    裴庆琪

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

刘云的其他基金

医学虚实融合系统中的实时手势建模与识别技术研究
  • 批准号:
    61040047
  • 批准年份:
    2010
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目
视频图像中人体目标检测算法的研究
  • 批准号:
    60641010
  • 批准年份:
    2006
  • 资助金额:
    15.0 万元
  • 项目类别:
    专项基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码