数据驱动下的全景视频感知模型

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61876013
  • 项目类别:
    面上项目
  • 资助金额:
    62.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0609.认知与神经科学启发的人工智‍能
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Along with the recent development of virtual reality, panoramic video will be a potential direction of the future multimedia technology, providing immersive quality of experience (QoE). In contrast to traditional video, panoramic video has wider range, more content and higher resolution. Therefore, panoramic video produces enormous data, posing the challenge to computation and communication bandwidth. On the other hand, there exists large perceptual redundancy in panoramic video, as the field of video (FoV) of human only covers 1/10 area of panoramic video frames. Thus, it is necessary to study on the perception model of panoramic video for removing the perceptual redundancy of panoramic video. To this end, this project will focus on the data-driven perception model of panoramic video, which aims at predicting FoV and eye fixations on panoramic video. Specifically, this project will conduct the interdisciplinary research of cognition, computing and signal processing. The main content of our project includes: (1) Large-scale perception database and human behavior analysis for panoramic video; (2) Deep inverse reinforcement learning based FoV prediction of panoramic video; (3) human behavior oriented internal-FoV attention model of panoramic video; (4) Perception-inspired panoramic video compression demonstration platform. This project will provide the theoretical foundation for panoramic video compression and processing, and it will technically support the new multimedia application of virtual reality.
近年来,随着虚拟现实技术的发展,具有沉浸式用户体验的全景视频将成为未来多媒体技术的重要发展方向。与传统视频相比,全景视频覆盖全、内容多、分辨率高,将产生大量多媒体数据,造成计算与通信资源极度受限;另一方面,人类观看全景视频的视场仅占全景视频覆盖区域的1/10,存在大量感知冗余;因此,迫切需要预测人类对全景视频的感知行为。利用已有研究基础,本项目将研究数据驱动下的全景视频感知模型,基于深度模仿学习预测人类的视场与关注区域,挖掘全景视频感知冗余。具体地,本项目拟重点开展认知、计算与信号处理交叉的理论研究,主要研究内容包括:(1)全景视频感知数据库及人类感知行为分析;(2)基于深度反向强化学习的全景视频视场预测方法;(3)面向人类感知行为的视场内视觉注意模型;(4)基于感知模型的全景视频压缩演示验证平台。本项目将为全景视频感知模型提供新的理论依据与技术支持,促进全景视频处理技术的发展。

结项摘要

在本项目支持下,项目负责人及其团队从人类视觉感知机理出发,开展认知、计算和信号处理等多学科前沿交叉研究,构建大规模全景视频感知数据库,分析和预测人类感知行为,构建基于人类感知的全景视频感知模型,为大幅降低全景视频数据量提供模型基础,达到预期的研究目标。取得的主要创新成果如下。.1、针对缺少全景视频人类视场及关注点数据的现状,构建大规模全景视频感知数据库,并标注人类头动以及关注点数据,揭示人类感知行为规律。统计实验结果验证:人类感知关注行为具有中心偏置且一致性,为后续建模和方法设计奠定理论基础。.2、针对全景视频人类视场难以预测的难题,建立深度学习网络自动提取视场相关特征并设计视场回报函数,提出深度反向强化学习方法以优化视场预测,实现在线和离线场景下的视场准确预测。实验结果表明:本项目可准确预测人类观看视窗,与同期先进方法相比,准确性的关键指标CC指标提升24%。.3、针对全景视频关注点受视场干扰的困境,提出不同视场下的多任务学习方法,构建视场内多任务视觉注意模型,准确预测全景视频中的人类关注点。实验结果表明:本项目可大幅提升全景视频显著性预测准确性,CC指标提升28%。.4、为验证上述关键技术,本项目构建全景视频压缩演示验证平台,在相同主观质量条件下,可节省全景视频28%的压缩码率。.本项目在IEEE TPAMI(影响因子:24.31)、TIP、IJCV等SCI期刊论文发表论文28篇,均为一区论文,其中IEEE期刊论文26篇;在IEEE ICCV、CVPR、ECCV、DCC等国际顶级/重要会议(CCF A/B类)发表EI论文24篇;获IEEE会议最佳论文奖1项;SCI他引超1000次;获得发明专利13项、软件著作权3项;提交国际标准采纳技术提案5项。获教育部技术发明一等奖(项目负责人排名:1)、中国科协求是杰出青年奖。项目负责人徐迈入选教育部“长江学者”奖励计划特聘教授,培养的学生获北京市优秀博士论文、中国图象图形学学会优秀博士学位论文。

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(13)
会议论文数量(24)
专利数量(11)
State-of-the-Art in 360° Video/Image Processing: Perception, Assessment and Compression
最先进的 360° 视频/图像处理:感知、评估和压缩
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    IEEE Journal of Selected Topics in Signal Processing (JSTSP) (ESI高被引论文)
  • 影响因子:
    --
  • 作者:
    Mai Xu;Chen Li;Shanyi Zhang;Patrick Le Callet
  • 通讯作者:
    Patrick Le Callet
Saliency Prediction on Omnidirectional Image With Generative Adversarial Imitation Learning
利用生成对抗性模仿学习对全向图像进行显着性预测
  • DOI:
    10.1109/tip.2021.3050861
  • 发表时间:
    2019-04
  • 期刊:
    IEEE Transactions on Image Processing (TIP)
  • 影响因子:
    --
  • 作者:
    Mai Xu;Li Yang;Xiaoming Tao;Yiping Duan;Zulin Wang
  • 通讯作者:
    Zulin Wang
DeepVS2.0: A Saliency-Structured Deep Learning Method for Predicting Dynamic Visual Attention
DeepVS2.0:一种预测动态视觉注意力的显着性结构深度学习方法
  • DOI:
    10.1007/s11263-020-01371-6
  • 发表时间:
    2020-08
  • 期刊:
    International Journal of Computer Vision (IJCV) 2020 (DOI: 10.1007/s11263-020-01371-6)
  • 影响因子:
    --
  • 作者:
    Lai Jiang;Mai Xu;Zulin Wang;Leonid Sigal
  • 通讯作者:
    Leonid Sigal
Attention-Based Deep Reinforcement Learning for Virtual Cinematography of 360∘ Videos
基于注意力的深度强化学习,用于 360° 视频虚拟电影摄影
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    IEEE Transactions on Multimedia
  • 影响因子:
    7.3
  • 作者:
    Jianyi Wang;Mai Xu;Lai Jiang;Yuhang Song
  • 通讯作者:
    Yuhang Song
Predicting Head Movement in Panoramic Video: A Deep Reinforcement Learning Approach
预测全景视频中的头部运动:深度强化学习方法
  • DOI:
    10.1109/tpami.2018.28587
  • 发表时间:
    2019
  • 期刊:
    IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI) (ESI高被引论文)
  • 影响因子:
    --
  • 作者:
    Mai Xu;Yuhang Song;Jianyi Wang;Minglang Qiao;Liangyu Huo;Zulin Wang
  • 通讯作者:
    Zulin Wang

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

β-PbO2 /TiO2纳米管电极的制备及其电催化降解苯酚
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    应用化学
  • 影响因子:
    --
  • 作者:
    洪萍;王凤武;徐迈;魏亦军
  • 通讯作者:
    魏亦军
Fabrication of La-doped TiO2 Film Electrode and investigation of its electrocatalytic activity for furfural reduction
La掺杂TiO2薄膜电极的制备及其糠醛还原电催化活性研究
  • DOI:
    10.1016/j.electacta.2014.11.203
  • 发表时间:
    2015-01
  • 期刊:
    Electrochimical Acta
  • 影响因子:
    --
  • 作者:
    王凤武;徐迈;魏琳
  • 通讯作者:
    魏琳
Electrocatalytic degradation of methylene blue on Co doped Ti/TiO2 nanotube/PbO2 anodes prepared by pulse electrodeposition
脉冲电沉积Co掺杂Ti/TiO2纳米管/PbO2阳极上电催化降解亚甲基蓝
  • DOI:
    10.1016/j.jelechem.2015.11.009
  • 发表时间:
    2015-12
  • 期刊:
    Journal of Electroanalytical Chemistry
  • 影响因子:
    4.5
  • 作者:
    王灿永;王凤武;徐迈;方文彦
  • 通讯作者:
    方文彦
面向体验质量的多媒体计算通信
  • DOI:
    10.11834/jig.200864
  • 发表时间:
    2021
  • 期刊:
    中国图象图形学报
  • 影响因子:
    --
  • 作者:
    陶晓明;杨铀;徐迈;段一平;黄丹蓝;刘文予
  • 通讯作者:
    刘文予
Ti/nano TiO2-ZrO2 修饰电极电催化还原马来酸制备丁二酸
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    化学学报
  • 影响因子:
    --
  • 作者:
    徐迈;王凤武;魏亦军
  • 通讯作者:
    魏亦军

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

徐迈的其他基金

火星表面全景视频编码与立体增强技术
  • 批准号:
    62231002
  • 批准年份:
    2022
  • 资助金额:
    287.00 万元
  • 项目类别:
    重点项目
基于多模态知识塔的可解释神经网络
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    247 万元
  • 项目类别:
火星表面全景视频编码与立体增强技术
  • 批准号:
    62250001
  • 批准年份:
    2022
  • 资助金额:
    287 万元
  • 项目类别:
    重点项目
基于知识塔的可解释神经网络
  • 批准号:
    62050175
  • 批准年份:
    2020
  • 资助金额:
    100 万元
  • 项目类别:
    专项基金项目
视频压缩与传输
  • 批准号:
    61922009
  • 批准年份:
    2019
  • 资助金额:
    130 万元
  • 项目类别:
    优秀青年科学基金项目
基于视觉感知模型的视频编码关键技术研究
  • 批准号:
    61573037
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
基于知识域与数据域协同的图像压缩算法研究
  • 批准号:
    61202139
  • 批准年份:
    2012
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码